Александр Витязь (Corezoid): чат-ботов, как отдельного вида софта, не существует

Автор: Технослав Бергамот, 03 мая 2023, 11:54

Александр Витязь — знаковая фигура в IT-сообществе. Он 17 лет возглавлял ЦЭБ (Центр Электронного Бизнеса) в Приватбанке, где под его началом и были разработаны передовые банковские продукты: от Приват24 (в четырех своих ипостасях — SMS, мобильной, веб-версии и чате) и платежной системы LiqPay до Р2Р-переводов и оплаты с помощью QR-кода.  Мы все, например, привыкли к аутентификации через SMS, которой сегодня пользуются все банки и мессенджеры, но впервые она была реализована именно в Приватбанке. С 2017 года Витязь занимается собственной компанией Corezoid Inc., основу бизнеса которой составляет одноименная фирменная разработка. Описать суть системы Corezoid в двух словах, мягко говоря, непросто. Поначалу это был конструктор, который сейчас подходил бы под понятие zero coding, затем сами же создатели стали называть свое детище операционной системой. В итоге пришли к понятию «оркестратор», которое тоже требует объяснения неподготовленному человеку (об этом мы тоже поговорили с Александром Витязем).


Скриншот из видео на YouTube-канале «Большая рыба с Александром Колбом»

Модели монетизации Corezoid — это SaaS и OnPremise, современная и понятная для бизнеса — подписка либо покупка лицензии на использование ПО. Среди клиентов Corezoid Inc. крупные банки, розничные сети и международные корпорации. Хотя использовать Corezoid может и ФОП, например, для создания чат-бота. Собственно, поговорить мы собирались именно о чат-ботах, но кругозор и видение Александра Витязя настолько широк (например, он уверен, что все в мире можно описать с помощью графов акторов, то есть построить и посчитать связи между всеми элементами в системе, об этом он пишет монографию «Кодекс Акторов»), что разговор предсказуемо охватил более широкие темы — от изменений рынка программистов с появлением ИИ и голосовых интерфейсов в банковских приложениях до низкой автономности очков дополненной реальности и наступления энергетического коммунизма.

gg: Как компании могут получить пользу от чат-ботов?

Александр Витязь: Зайду с джокера — чат-ботов как отдельного вида софта не существует. То, что в быту зовется чат-ботом, это приложение которое имеет «фронт» в чате. Сущностная часть любого приложения — это «бэк» и «мидл», логика и архитектура находится там. Если у вас есть первое и второе, у вас есть все для того, чтобы подключить любой «фронт» (или несколько одновременно). Например, если вы лучше всех вычисляете sin, то на каких фронтах вводится x и выводится результат sin(x) не принципиально, это исключительно предпочтения клиента. В идеале клиент должен иметь возможность бесшовно путешествовать между разными фронтами

Чат-бот — это «фронт», под капотом которого «мидл» и «бэкэнд». Это то, с чем клиент взаимодействует. Если правильно спроектировать то, что находится под капотом, то количество фронтов может быть неограниченным. Мы фокусируемся на алгоритмах. И на самом деле, если делать непродуманно и начинать проектирование под чат-бот, то архитектура вряд ли будет годиться для приложения. Придется все переделывать, когда вы захотите или созреете для приложения. А если смотреть на то, что чат-боты — это один из «фронтов» возможных для алгоритма, тогда вы все сделаете в «бэке» и в «мидле» правильно. И будут мирно существовать и боты, и приложение, и веб-сайт — что угодно.

Вопрос о пользе  чат-ботов не стоит — пользу приносит любая коммуникация и хорош любой способ коммуникации с клиентом, чем больше коммуникационная поверхность компании тем лучше. Вопрос в организации управления коммуникацией, измерении и принятии решений. Конечно, если у вас 5 клиентов то писать приложение и даже бота нерационально.

Задачи с помощью чат-ботов можно решать любые, так как алгоритм находится не в чат-боте, а в бэк-енде. Более того — использование бота в качестве фронта приложения дешевле и быстрее чем разработка нативного приложения

gg: Судя по предыдущему названию вашей компании вы специализируетесь именно на middleware?

Александр Витязь: Мы помогаем строить мостики между «бэкендом», «фронтом» и внешним софтом. Наша модель заработка — продажа лицензии. Клиент подписывается либо покупает полную лицензию. При этом мы оказываем услуги по внедрению всего этого, помогаем стартовать, обучаем и так далее.  Наша специализация — это цифровое ядро (мидл, бэк и все что между ними и фронтом). Нам удалось сделать такую платформу, что она постепенно поглощает в себя всю софтверную инфраструктуру предприятия. Мы так не задумывали, но так эволюционно получилось, если строишь кровеносную систему, то рано или поздно придется построить сердце и мозг.


Иллюстрация: Corezoid как оркестратор

gg: То есть синоним вашей компании — интегратор?

Александр Витязь: Есть более универсальный термин  — оркестратор сервисов. Его используют наши клиенты, это отраслевое понятие. Интегратор — это слишком узкое понятие. Соединил и что дальше? А оркестратор — это и про соединение,  и про управление. Мало соединить все кабеля, надо всем этим дальше еще управлять. Среди вариантов названий у нас было — директор и дирижер, но не прижилось. Сначала это был конвейер, который превратился в оркестратор сервисов, затем операционная система, позже мы стали строить цифровое ядро, после чего перешли на уровень создания процессора акторов (Actor Engine). Теперь мы создали возможность объединять акторы в граф акторов, и Corezoid стал оркестратором. Смыслы безусловно сохранились, а уровень понимания того что строит Corezoid качественно вырос. 


Иллюстрация: Corezoid как ERP-система

gg: Как вы оцениваете рынок чат-ботов в Украине?

Александр Витязь: Нет смысла измерять, но в пределе он равен количеству живых бизнесов. Я бы по-другому вопрос сформулировал: скольким компаниям нужна коммуникация с клиентом? Всем. И сотрудникам тоже всем. Вот это ответ на вопрос про размер рынка.

gg: И какую долю в вашей компании занимают чат-боты?

Александр Витязь: Давайте поменяем слово «чат-бот» на «фронт». В работе нашей компании всегда есть место для «фронта», потому что «бэкенд» и «мидл» должен как-то коммуницировать с потребителем и что-то кому-то показывать. А вот какой он и какая доля того или иного вида «фронтэнда» — это уже ситуативно. Мы 100% клиентов поставляем цифровое ядро, кто-то к нему подключает только чат, кто-то приложение, кто-то все сразу.

gg: Если IT в этой картине мира всегда связаны с коммуникациями, выходит, что вы глобально участвуете в процессе автоматизации всего, что можно автоматизировать?

Александр Витязь: Не совсем так. Потому что пока не все можно автоматизировать и не все нужно. Если рассуждать в этом контексте, то коммуникатором или мессенджером можно назвать и асфальтоукладчик. Ведь, когда мы с вами строим дорогу, у людей появляется возможность куда-то ездить, например, друг к другу в гости и общаться. То есть дорогу мы тоже можем рассматривать в какой-то степени, как мессенджер. Автоматизирована она или нет — это уже второй вопрос. Где-то это можно, и не вредит коммуникации. Где-то — это сложно.

На мои вопросы тот же GPT с трудом отвечает. Но если я буду свои вопросы адресовать какому-нибудь профессору, он сегодня ответит мне лучше, чем GPT. Пока лучше.

При этом на вопросы уровня оператора колл-центра GPT очень прилично отвечает уже сейчас

Важно создавать каналы коммуникации, легко и быстро. А вот как там общаться? Какая доля в них автоматизации — это вопрос менеджмента. Например, мы сегодня для себя уже решили, что на первый уровень саппорта будет отвечать GPT. А второй уровень — если клиент недоволен ответами первого уровня (например, в NPS оценку ставит плохую), мы передаем уже на человека. Это вполне нормально.

gg: Что преобладает в платформах для чат-ботов в нашей стране — Telegram или Viber?

Александр Витязь: Все зависит от сегмента, где-то Viber №1, где-то Telegram. То есть правильно сразу подключать все каналы и давать клиенту выбор.

gg: Какого размера компании к вам обращаются?

Александр Витязь:  Вообще любые. От частных предпринимателей до крупных корпораций. У самого большого клиента 200 миллиардов капитализации. Подписка на corezoid.com стартует с 30 долларов в месяц.

gg: Какими скиллами должен обладать частный предприниматель, чтобы пользоваться Corezoid?

Александр Витязь: Что такое частный предприниматель? Это ж не профессия. Если — это инженер в форме частного предпринимателя, ему все понятно сразу что нужно делать. Если парикмахер — частный предприниматель, наверное ему будет сложно. Нужны скиллы инженера и обученного бизнес-аналитика. MySQL, чуть-чуть JavaScript. Можно пользоваться и вообще без этих знаний, но реально чего-то стоящего не сделать. Нужен какой-то инженерный бэкграунд в виде образования профильного или опыта практической работы. Потребность зависит от задачи, которую вы решаете. 

Если вам нужно сделать простенького робота, конечно, инженер для этого не нужен

Если какой-то сложный проект, и алгоритмов в нем миллион, то без инженера высочайшей квалификации не обойтись. 

gg: Из каких шагов состоит разработка чат-бота?

Александр Витязь: Компании нужно знать 2 вещи — иметь отраслевую экспертизу и зайти на corezoid.com, все остальное поможем, покажем, научим, запустим и сопроводим. Мы предоставляем готовый оркестратор коммуникаций (не путать с оркестратором сервисов), он позволяет настроить все каналы коммуникаций чаты, почту, голос, формы, комментарии, добавить gpt, и затем управлять клиентами, операторами, ботами, контентом и календарем событий.

gg: Какие преимущества предоставляет Corezoid для создания чат-ботов?

Александр Витязь: Все в одном — фронт-мидл-бэк, биллинг, антифрод, ИИ, CRM, платежи,  обучение и выдающаяся экспертиза. С помощью Corezoid чат-боты созданы в Синево, ПУМБ, Metro, УЖД, Ибис и много других. Из последних — kai.ai — очень полезный и перспективный проект психологической помощи. 

gg: Какие сложности и риски существуют при создании и запуске чат-бота для бизнеса?

Александр Витязь: Риск есть архитектурный — если неправильно ее спроектировать, то пластичность решения будет низкой, а цена доработок высокой.

gg: Как вы измеряете успех чат-бота?

Александр Витязь: Обычные бизнес-метрики: количество клиентов, транзакция, оценка диалога, NPS (индекс потребительской лояльности, Net Promoter Score, методика опроса, по которой клиента просят оценить от 1 до 10 вероятность того, что он порекомендует компанию своему окружению — примечание редакции gg). С появлением Большой Языковой Модели (БЯМ) будем внедрять косвенную оценку, например по тональности речи клиента.

gg: Выходит, что чат-боты имеют смысл, только если у тебя большая аудитория?

Александр Витязь: Чат-боты — это  не только про коммерцию, но и про коммуникацию. Это канал удобный для клиентов, чтобы задать вопрос. Но чат-бот это все-таки формат коммуникации в виде командной строки. Если вам, например, нужно загрузить тысячу позиций, наверное, мессенджер не самый удобный для этого формат.

В нашем мире чат-боты не исключают приложения. Они друг друга дополняют, чаты вызываются из приложения, приложения вызываются из чата. Правильный ответ — надо делать все, это сообщающиеся сосуды.

Для каких-то экспериментов, проверок гипотез — понятно, что чат — это самый дешевый канал

Быстро собрал в «бэке» алгоритм, запустил бота, посмотрел — как клиенты на это реагируют. И тогда уже переносишь в приложение. Как песочница для экспериментов, MVP, чат-бот — это правильное решение. Потому что тебе в этом случае не нужно заниматься «фронтом». А если ты делаешь приложение, то надо сразу на трех направлениях работать: Android, iOS, люди дорогие и все такое прочее.  Цена ошибки, если сразу идею воплощать в приложение, наверное, от десятков тысяч долларов и месяцы времени. 

gg: Если кто-то решил запустить чат-бот для своей компании, с чего бы вы посоветовали начать?

Александр Витязь: Давать советы очень легко (смеется). Если кому-то пришла именно идея “запустить”, то это беда. Потому что он даст команду сделать чат-бота. Ему что-то склепают, а дальше начинается реальная жизнь — доработки, расходы и прочие открытия. То есть этот чат-бот (приложение, сайт — не важно) постоянно будет отвлекать внимание, и все это сразу становится точкой расходов. А вот, чтобы превратить это в точку доходов, надо серьезно поработать и подумать. Программист это за менеджера не сделает. 

Какой тут выход? Думать, проектировать. Если нет опыта, то или куда-то обращаться, или выращивать своего специалиста. Serverless — это же парадигма правильная. Она, конечно, не развилась до правильного вида, так, как была задумана. Но концепция облачного хостинга, в теории правильная. Раньше ты обслуживал сам сервер —  покупал, чинил. Плодил этих девопсов вокруг. Теперь все переехало в облако, но девопсов же меньше, кстати, не стало. Потому что serverless в облаках пока не случился. То есть все равно я там покупаю сервера. Да, я их у себя не держу, но все равно я мыслю серверами, версиями ОС и прочими процессорами. Это большая проблема.

Но когда-нибудь я не буду этими категориями мыслить. Индустрия движется в эту сторону, но пока еще не дошла до финиша. Я буду работать с какой-то базой данных или со знаниями. И не париться вопросами — какой там процессор стоит, сервер и сколько памяти я купил или нет.

gg: Известно ли вам что-то об использовании чат-ботов в Украине в сфере образования?

Александр Витязь: Наши клиенты используют чат-боты для обучения сотрудников и клиентов. Но, повторюсь, обучение — это контент и алгоритмы, а не фронт.

В сфере образования у нас есть феноменальный клиент spilno.school, обязательно почитайте куда и как они двигаются.

gg: Как вы думаете — почему так много разговоров про чат-боты последние годы?

Александр Витязь: Потому что этот опыт есть у большинства пользователей мессенджеров — боты есть десятки лет и люди к ним привыкли. Потому что есть легенда про простой вход в IT. Есть два мифа — один про тестировщиков, второй — про чат-ботов. Как легко вошел, так легко и вышел. Если ты не профессионал, то не задержишься в профессии. Некоторые бизнесы идут в мессенджеры, потому что там их аудитория. Некоторые идут, потому что нет бюджета на полноценное приложение. Приложения — это дорого. Это — дизайнеры, iOS-разработчики с огромными зарплатами и так далее. Но бывает так, что и деньги есть, и приложение есть, но аудитория живет в чатах — это ситуативно. У нас есть клиенты, у которых в чатах больше трафика, а есть — наоборот: чат — вспомогательный, а основной трафик в приложении.

Разговоры про низкую стоимость входа — это спекуляция

Вот в медицину низкая стоимость входа существует? И это касается любой профессии. Вошел, что дальше? Если нет способностей, точно также и вышел. Понятно, что курсам, которые учат программированию, нужно как-то себя продавать. И месседж про легкий вход — он работает. Но это же почти обман.

gg: А что вы тогда скажете про zero coding? 

Александр Витязь: Zero Coding сейчас уже ChatGPT делает. Надо ли учить это в школе, если подобную работу компьютер уже делает лучше?

Я вам скажу, что мы уже несколько человек уволили джуниоров, джаваскриптистов и дизайнеров, потому что GPT их работу делает лучше.

Шуточная иллюстрация для социальных сетей, созданная дизайнерами Corezoid

gg: Тут у нас много общего с журналистикой...

Александр Витязь: А чем программа, с точки зрения языка и лингвистики, отличается от текста? И то, и другое — язык с разным синтаксисом. Текст на языке программирования — это подмножество естественного языка. Поэтому (упрощаю) GPT так легко и программирует, что это проще, чем освоить натуральный язык.

Zero Coding — есть как явление, но как профессии его нет, на то он и Zero Coding, что им могут пользоваться все

Например, что такое — профессия инженера? Ты должен в математике разбираться. Вот есть профессия переводчика, есть — лингвиста. Кто из них лучше разбирается в языке? Лингвист. А переводчик — лучше пользуется языком. Вопрос: если мы говорим, что инженер-разработчик — это переводчик, тогда мы можем выбросить слово «инженер». А если мы говорим, что он таки инженер, то тогда он должен быть больше лингвистом. В лингвистике очень много математики, на самом деле. Это и есть математика, потому что это структура, деревья и все прочее.

На вопрос «Можно ли быть разработчиком без знания математики» ответ — нельзя. Притворяться можно, что многие с успехом и делали. Но я никогда не любил эти выражения — low code и zero code, потому что за ними теряется суть. С Corezoid тебе не надо знать какие-то спецификации языка. Но ты должен знать математику, иметь предметную экспертизу чтобы сделать сложный алгоритм. И если у тебя нет ни способностей, ни знаний, ты ничего не сделаешь. То есть, простой процесс — сделаешь, а сложный — нет.

Когда я учился в институте, моя профессия называлась прикладная математика, инженер-математик в дипломе записано. И тогда не было еще профессии программиста в чистом виде. Но структура этой профессии заключалась в том, что сначала ты учишь математику и параллельно учишься программировать на компьютере. А вот профессия DevOps (development & operations — методология разработки сложного программного обеспечения, которое постоянно совершенствуется в процессе использования — примечание редакции) — это вообще был соседний факультет. Потому что задача прикладного математика — сделать математическую модель, алгоритм решения задачи. Для этого, на самом деле, кроме головы, ручки и бумаги ничего не надо.

Чтобы различать программистов с инженерной подготовкой и без, рынок изобрел слово кодер. Иногда у него есть неприличная приставка :-)

Безусловно, есть ребята самоучки, которые освоили основы профессии, но это больше исключение чем правило.

gg: Выходит, что разработчик чат-ботов — это тоже функция, но не существующая профессия?

Александр Витязь: По факту на джоб сайтах она есть, но, по моему мнению, — ее нет, это просто один из видов работ для программиста. Есть рынок. К примеру, какая-то компания проснулась, пишет в объявлении «Я хочу бота разработать». Какие-то люди туда приходят. Когда встречаются неквалифицированные заказчик и исполнитель, то то, что они смогут сделать, скорее всего, будет «не очень». 

«Разработчиком» чат-ботов стать легко и поэтому перспектив у такой «профессии» нет. Это оксюморон типа «пользователь смартфона». Но есть профессия инженера, а разработка чат-ботов - один из видов работ, которую делает инженер. Надо становиться алгоритмистом, для этого пройти хотя бы начальный курс Computer Science. 

gg: Какой бы вы совет дали для студентов — что им стоит изучать сейчас, чтобы быть конкурентоспособным в будущем?

Александр Витязь: Совет не меняется на протяжении 20 лет — изучать математику. Наша разница пока между тем, что мы называем интеллектом искусственным и естественным — в эмерджетности. В умении создавать и применять одни знания и порождать другие. Вот сегодня в GPT, там и близко нет интеллекта. Но ничто не помешает ему появиться. Пока есть ниша — соединять точки в графе, создавать знания.

Переводить как Google Translate техническое задание на JavaScript — это же не работа. Работа — это написать ТЗ

Например, если раньше на вакансию джаваскрипта мы получали в неделю 10 откликов, то сейчас, после появления GPT, уже 200. Разница в 20 раз. Конечно, есть еще фактор и военный, потому что часть фирм закрывается, переезжает, но тренд этот усилился именно с момента появления gpt. Зарплаты пока не падают. Специалистов начального уровня на рынке стало больше, а потребности в них — меньше. Я думаю, что для HTML-верстальщика потребность уже не вернется, скорее всего.

gg: Выходит, программисты в будущем больше будут заниматься архитектурой?

Александр Витязь: Но они, вообще-то, именно так и появились. Отец сегодняшнего взрыва с большими языковыми моделями, точнее, один из отцов, — Джуда Перл. Он придумал байесовские сети. То есть математический аппарат, который вот сейчас наконец-то получил реальное воплощение. Но когда он его придумал, он же формулы рисовал. А не ночью сидел за клавиатурой и текст набирал. Он создал матаппарат, который вот только сейчас смог реализоваться, потому что достаточно развились вычислительные мощности.

gg: Чат-боты уже достигли пика в своем развитии?

Александр Витязь: Не достигли, наоборот, все только начинается. Внедрение GPT позволит сделать коммуникацию качественно лучше, а применения разнообразнее.

Большая языковая модель (БЯМ) + прямые знания = экспертная система (ЭС)

Я больше скажу — безо всяких лингвистических моделей у нас в колл-центре ПриватБанка боты с 2005 года жили. И 70% клиентов, которые с ним общались, думали, что они общаются с человеком. Эти роботы работали просто по ключевым словам. Берешь статистику вопросов, пишешь на них ответы, ключевики — все прекрасно работает. Если человеку нужно узнать баланс, не надо же профессора сажать, чтобы ответить на этот вопрос. Так или иначе он в чате напишет «какой у меня баланс», «какой остаток». Какие-то синонимы. Я когда статистику увидел, то поразился. Большая Языковая Модель еще лучше работает. Но даже при тупой автоматизации правило Парето почти соблюдалось. Практически 80 процентов клиентов не понимали кто им отвечает, человек или робот.

gg: У вас в саппорте реально работает ChatGPT и отвечает не по скриптам?

Александр Витязь: У операторов на самом деле тоже есть скрипты. Это же не фристайл — что хочет, то и отвечает. Есть документация по продуктам, мануалы, которые можно полистать, FAQ всякие, тайминги и так далее. Сейчас у нас есть такая штука, которая называется «оркестратор коммуникации». Кстати, для понимания эволюции — когда мы только начинали работать с чатами и ботами, очень давно, это называлось бот-платформой. Но вот уже два года или больше это называется у нас оркестратор коммуникации. И эта эволюция названия показывает насколько наш взгляд изменился — от частного к общему. И вот сегодня у нас искусственный интеллект стоит в этом оркестраторе, как сотрудник. И тот, кто этот оркестратор настраивает, ставит его вместо реального сотрудника. Причем языковую модель можно подключать любую, не обязательно GPT, — гугловскую, фейсбуковскую или несколько одновременно. Ту, которая будет на рынке. Клиент заводит аккаунт, вводит ключи и подключает нужный ему интеллект.

gg: А нет ли риска, что GPT даст какой-то ответ, который будет нерелевантен или вообще нанесет вред?

Александр Витязь: Контролируйте, можно же проверить перед запуском, протестировать. А нет риска, что оператор чата напишет что-то не то? На человека гораздо больше издержки по управлению всем этим хозяйством. Да, за роботом нужно следить, но и за людьми тоже. Поэтому с точки зрения управления коммуникацией ничего не меняется.

gg: Какие новые возможности для чат-ботов появились в последний год?

Александр Витязь: Мультиканальность, БЯМ, ЭС. Мультиканальность — на рынок мессенджеров для бизнеса вышли Apple, Google, WhatsApp, Viber. Это увеличило требования к правильной архитектуре, качеству, юзабилити, дизайну и вообще подняло планку — для того чтобы попасть в партнеры надо очень и очень постараться. БЯМ позволяет лучше понимать вопросы клиентов и создавать новые продукты в мессенджерах — например экспертные системы. Это, в свою очередь, снижает требования к разработчиками ботов — простенькую ЭС-отвечальщика на вопросы по документации за пару минут может создать любой продвинутый пользователь ПК.

gg: А что изменилось с появлением ChatGPT? Это уже можно назвать изменением правил игры или еще нет?

Александр Витязь: Это создает новый интерфейс. В широком смысле слова. Предприятие — это какая-то функция, алгоритм. Меняет колеса, доставляет еду еще что-то, не важно. Осуществляет какую-то функцию.  И для того, чтобы вы эту функцию употребили, вам нужен какой-то интерфейс. Приложение, бот на естественном языке, не на естественном. Формы какие-то и так далее. Но наш с вами нативный интерфейс — язык — появление большой языковой модели сильно упрощает.

Например, в банковском приложении 500 страниц. Добавление каждой новой фичи — это еще страницы, люди, задачи, документация, «бэкэнды» и прочее. А теперь представьте завтра добавилось 501-я услуга. И мы не обновляем приложение. Потому что вы эту услугу потребляете через бота. 

Интерфейсы эти не сегодня появились — Siri, вот это все. Голосовые роботы IVR в колл-центрах — это ж их предтечи. Но у них не было большой языковой модели, то есть, Siri элементарно почти ничего не понимала. А еще с нашим акцентом она вообще ничего не понимала. Но вот именно эту задачу интерфейса большая модель и решила.

Как бы вы не перекрутили фразу: «молоко купи», «купи молока», «сбегай за молоком», Siri поймет там только две фразы из десяти возможных. А большая языковая модель поймет все

Исейчас уже любой чайник их может делать. Экспертную систему какую-то, например, для начинающих ваших коллег. Если у вас есть инструкция, вы ее даете большой языковой модели и дальше она может работать.

БЯМ это наши новые глаза, уши, язык и память. Несколько лет тому я говорил, что появится возможность общаться с мастерами прошлого на основе их работ. (Но перспективы у массового появления правильных собеседников есть: будут Чеховы в облаках, нейросети, построенные на основе произведений, писем и других сохранившихся текстов. У нас появится прямой доступ к величайшим умам, тогда вы, журналисты, сможете брать любые интервью и вам никто не откажет, — интервью от 2019 г).

gg: Потребителю она говорит какую-то цитату или правильный ответ на заданный вопрос?

Александр Витязь: Все еще интереснее — вы даете ей учебник геометрии за седьмой класс, и она после этого может решать задачки за седьмой класс. Речь идет уже не о буквальном понимании, а о понимании правил использования. И это как раз не сложно. Это все равно еще не интеллект, но интерфейс поменялся качественно, потому что вам уже не надо давать жесткие команды. Чем отличается натуральный язык от языка программирования? Жесткостью синтаксиса. Чтоб вас понимал компьютер в том виде, в каком он сегодня существует, без жесткого синтаксиса не обойтись.

И обычный программист — это переводчик с открытого синтаксиса на жесткий

Но кто-то передает информацию через этот синтаксис. Вот этот кто-то — это и есть настоящий инженер. Тот кто говорит, как и что сделать. В чем вообще разрыв в классической парадигме программирования? В том, что product owner (владелец продукта — так в разработке называют ответственного за развитие и управление разрабатываемого программного продукта — примечание редакции) не алгоритмист, но он, например, меняет валюту. А программист — не финансист и слова фьючерс и правил работы рынка не знает. И вот они между собой пытаются найти общий язык. И это проблема. С большой языковой моделью этот разрыв ликвидируется, мы все станем алгоритмистами и постановщиками задач. Потому что компьютер уже понимает почти любое наше сообщение. 

gg: В ближайшее время даже в банковских приложениях  мы должны увидеть какие-то голосовые функции?

Александр Витязь: Да там и раньше пытались, но плохо получалось. Для того, чтобы сделать нормальное голосовое управление приложений. надо было заниматься тем, чем 15+ лет GPT занимался (я имею в виду компанию OpenAI). И иметь соответствующего класса специалистов и финасирование. Для украинской компании это нереально  — иметь такой бюджет и доступ к таким людям. И это касается не только Украины, а большинство стран и компаний. Мы видим сегодня, что от силы до 10 компаний в мире этим занимается. То есть их не десятки, и тем более не сотни. Потому что это дорогое удовольствие, gpt только на хостинг тратит сотни тысяч долларов в сутки.

gg: Кстати, о новых интерфейсах. Вы же делали приложение Приват24 для Google Glass. Как вы считаете — есть ли будущее у таких очков, например, сможет ли Apple сделать что-то, что изменит мир?

Александр Витязь: Google свой проект очков закрыла. У этих очков будущего нет. А вот у дополненной реальности будущее есть. А вот как она будет реализована — вопрос открытый. У большинства смартфонов автономность не очень сегодня, у очков еще хуже. Поэтому мы, когда приходим куда-то, сразу ищем зарядку. Это уже почти инстинкт. 

Я не знаю, что это будет, вопрос не к очкам, как таковым, а к источникам питания. Как только они станут миниатюрными (либо беспроводными), какая-то однозначная, если не революция, то движение в ее сторону, произойдет. Автономности не хватает. То же самое мы видим сегодня и в смартфонах, и в электромобилях, везде. Автомобили точки, когда уже можно ездить (хотя еще не так, как на бензине), уже достигли. 

gg: Когда кто-то говорит, что разработал чат-бота с ИИ, что он на самом деле имеет в виду?

Александр Витязь: До появления БЯМ — без понятия, преувеличивали наверное (смеется). Часто за ИИ выдавали ответы по ключевым словам. Реально сегодня использовать БЯМ для распознавания вопросов, создания ЭС, автоматизации работы кол-центров.

gg: У вас есть свое видение — как ИИ повлияет на человечество? Оно оптимистичное или пессимистичное?

Александр Витязь: Конечно есть, а у кого его нет?! (смеется) Во-первых, что считать оптимистичным или пессимистичным. Вот у вас, я знаю, есть коты. Вопрос: это вы ими управляете или они вами? А теперь вместо котов поставьте себя. Судя по фотографиям ваши коты счастливы. 

Жизнь уже меняется. Но не все можно экстраполировать. Вот когда человек идет в первый класс можно экстраполировать его жизнь до института что с ним будет происходить. Ну, плюс-минус. А теперь представьте, что вы не можете экстраполировать. Мы можем фантазировать. Какой у нас горизонт планирования сегодня? Кто планировал полгода назад, что начнутся увольнения джуниоров, джаваскриптистов и операторов колл-центров? Никто.

Большинство людей не работает на самом деле интеллектуально, они работают физически

Так вот физический труд останется, а интеллектуальный — не у всех. Но он всем и не нужен. Вопрос про зарплаты и доходы как-то решится, потому что экономика никуда не денется, она будет трансформироваться вместе с трудом.

Книга “Монстры доктора Эйнштейна” сообщает, что модель Вселенной может рассчитать 100 человек в мире, сложность моделей удваивается каждые 20 месяцев. Дальше проэкстраполируйте самостоятельно.

Ежемесячная активная аудитория GPT в марте 2023 составила около 100 миллионов.

Удвоим с поправкой на умных но принципиальных, получается 200 млн. В мире 8 млрд человек. Всего 2,5% человеков прошло тест на любопытство и интеллект. Безусловно, со временем количество пользователей вырастет за счет упрощения доступа, встраивания в привычные интерфейсы и т. д. Но в данном контексте важен именно первичный импульс - только 2,5% захотело немедленно прикоснуться к агрегированным знаниям всего человечества. Это к вопросу о том сколько людей работает головой, а сколько физически. Практически, произошел тест Тьюринга наоборот — компьютер тестирует человечество на интеллект.

С другой стороны роботу не нужна кока-кола, штаны, тушь для ресниц. И когда появится правильный, настоящий, автономный искусственный интеллект (АИИ), часть привычной нам экономики начнет меняться. 

gg: И чем больше будет роботов, тем больше потребуется людей, которые будут этих роботов создавать и обслуживать?

Александр Витязь: Роботы и АИИ — это две большие разницы. Роботы это материальное физическое присутствие АИИ, их нужно бесконечное количество. АИИ будет на старте несколько штук — по числу термоядерных стран, а в пределе 1, в науке это называется синглтон, There can be only one. АИИ без квантовых компьютеров не появится. АИИ очень связан с энергетикой. Во-первых, нужно очень много считать, во-вторых, вычислители нужно сильно охлаждать, в-третьих, все это нужно защищать физически и криптографически.

Роботы это следующие смартфоны и электроавтомобили, основной мозг которых находится в облаке. Пока их обслуживают люди. Но обслуживание электромобиля и бензинового автомобиля — это две большие разницы уже сегодня. Когда-то роботы научатся менять болтики и колеса. Это достаточно очевидно, это можно легко экстраполировать. Рабочие места для тех, кто работает руками, еще будут долго.

Все это постепенно поменяет принципы экономики, потому что суть экономики — это распределение и перераспределение доступа к энергии.

Если очень упростить, то когда запустится термоядерный реактор, появится энергетический коммунизм

Сегодня разница между самой бедной страной и самой богатой в количестве потребляемых киловатт на душу населения. Ну, или все можно привести к киловаттам. И вот, если возьмете американскую семью, там и какой-нибудь Бангладеш, то вы увидите, что разница между ними в доступе к энергии на порядки отличается.

Мы доход домохозяйства берем делим на стоимость киловатта, получаем количество энергии для среднего американца и среднего бангладешца. Но как только запустится условно бесконечный, бесплатный источник энергии, считайте, что наступил коммунизм с этой точки зрения. Нужно вам 50 киловатт в день? — Вот, берите. Это точка перегиба для библейской экономики (в поте лица твоего …).

Классическое понимание экономики исчезнет, как только появится условно-бесплатный источник энергии

Вам не надо зарабатывать деньги для того, чтобы работал холодильник. Или отопление, или еще что-то. Очень рекомендую книги Вацлава Смила,  очень концентрированная пища для ума.

gg: И последний вопрос: как может использовать чат-ботов медиа, например, gagadget?

Александр Витязь: Есть много вариантов: стрим новостей, опросы, работа с комьюнити, подписка, инвойсы, размещение рекламы, объявлений, микрообучение, радио — сейчас это больше вопрос идей, а не технических возможностей - например, вы можете за пару часов настроить чат gpt который будет давать возможность читателям говорить с контентом  всего вашего сайта, а это уже совсем новый опыт и для вас и для пользователей.

Загадка от Александра Витязя

Напоследок загадка про автономный искусственный интеллект от Александра Витязя: каким в этой схеме будет последнее слово? 

Для тех, кто хочет знать больше

QUOTA_BYTES_PER_ITEM quota exceeded