Олександр Вітязь - знакова фігура в IT-спільноті. Він 17 років очолював ЦЕБ (Центр Електронного Бізнесу) у ПриватБанку, де під його керівництвом і було розроблено передові банківські продукти: від Приват24 (у чотирьох своїх іпостасях - SMS, мобільній, веб-версії та чаті) та платіжної системи LiqPay до Р2Р-переказів та оплати за допомогою QR-коду. Ми всі, наприклад, звикли до автентифікації через SMS, якою сьогодні користуються всі банки та месенджери, але вперше її було реалізовано саме в ПриватБанку. З 2017 року Вітязь опікується власною компанією Corezoid Inc., основу бізнесу якої становить однойменна фірмова розробка. Описати суть системи Corezoid у двох словах, м'яко кажучи, непросто. Спочатку це був конструктор, який зараз підходив би під поняття zero coding, потім самі ж творці стали називати своє дітище операційною системою. Зрештою прийшли до поняття "оркестратор", яке теж потребує пояснення непідготовленій людині (про це ми теж поговорили з Олександром Вітязем).
Скриншот із відео на YouTube-каналі "Велика риба з Олександром Колбом"
Моделі монетизації Corezoid - це SaaS і OnPremise, сучасна і зрозуміла для бізнесу - підписка або купівля ліцензії на використання ПЗ. Серед клієнтів Corezoid Inc. великі банки, роздрібні мережі та міжнародні корпорації. Хоча використовувати Corezoid може і ФОП, наприклад, для створення чат-бота. Власне, поговорити ми збиралися саме про чат-боти, але світогляд і бачення Олександра Вітязя настільки широкий (наприклад, він упевнений, що все у світі можна описати за допомогою графів акторів, тобто побудувати й порахувати зв'язки між усіма елементами в системі, про це він пише монографію "Кодекс Акторів"), що розмова передбачувано охопила ширші теми - від змін ринку програмістів із появою ШІ й голосових інтерфейсів у банківських додатках до низької автономності окулярів доповненої реальності та настання енергетичного комунізму.
gg: Як компанії можуть отримати користь від чат-ботів?
Олександр Вітязь: Зайду з джокера - чат-ботів як окремого виду софту не існує. Те, що в побуті зветься чат-ботом, це застосунок, який має "фронт" у чаті. Сутнісна частина будь-якого застосунку - це "бек" і "мідл", логіка й архітектура знаходиться там. Якщо у вас є перше і друге, у вас є все для того, щоб підключити будь-який "фронт" (або кілька одночасно). Наприклад, якщо ви краще за всіх обчислюєте sin, то на яких фронтах вводиться x і виводиться результат sin(x) не принципово, це винятково переваги клієнта. В ідеалі клієнт повинен мати можливість безшовно подорожувати між різними фронтами
Чат-бот - це "фронт", під капотом якого "мідл" і "бекенд". Це те, з чим клієнт взаємодіє. Якщо правильно спроєктувати те, що знаходиться під капотом, то кількість фронтів може бути необмеженою. Ми фокусуємося на алгоритмах. І насправді, якщо робити непродумано та починати проєктування під чат-бот, то архітектура навряд чи буде придатною для застосунку. Доведеться все переробляти, коли ви захочете або дозрієте для застосунку. А якщо дивитися на те, що чат-боти - це один із "фронтів" можливих для алгоритму, тоді ви все зробите в "беку" і в "мідлі" правильно. І будуть мирно існувати і боти, і застосунок, і веб-сайт - що завгодно.
Питання про користь чат-ботів не стоїть - користь приносить будь-яка комунікація, і будь-який спосіб комунікації з клієнтом важливий, що більша комунікаційна поверхня компанії, то краще. Питання в організації управління комунікацією, вимірюванні та ухваленні рішень. Звичайно, якщо у вас 5 клієнтів, то писати застосунок і навіть бота нераціонально.
Завдання за допомогою чат-ботів можна розв'язувати будь-які, оскільки алгоритм знаходиться не в чат-боті, а в бек-енді. Ба більше - використання бота як фронту застосунку дешевше і швидше, ніж розробка нативного застосунку.
gg: Судячи з попередньої назви вашої компанії, ви спеціалізуєтеся саме на middleware?
Олександр Вітязь: Ми допомагаємо будувати містки між "бекендом", "фронтом" і зовнішнім софтом. Наша модель заробітку - продаж ліцензії. Клієнт підписується або купує повну ліцензію. Водночас ми надаємо послуги зі впровадження всього цього, допомагаємо стартувати, навчаємо тощо. Наша спеціалізація - це цифрове ядро (мідл, бек і все що між ними та фронтом). Нам вдалося зробити таку платформу, що вона поступово поглинає в себе всю софтверну інфраструктуру підприємства. Ми так не задумували, але так еволюційно вийшло, якщо будуєш кровоносну систему, то рано чи пізно доведеться побудувати серце і мозок.
Ілюстрація: Corezoid як оркестратор
gg: Тобто синонім вашої компанії - інтегратор?
Олександр Вітязь: Є більш універсальний термін - оркестратор сервісів. Його використовують наші клієнти, це галузеве поняття. Інтегратор - це занадто вузьке поняття. З'єднав і що далі? А оркестратор - це і про з'єднання, і про управління. Мало з'єднати всі кабелі, треба всім цим далі ще керувати. Серед варіантів назв у нас було - директор і диригент, але не прижилося. Спочатку це був конвеєр, який перетворився на оркестратор сервісів, потім операційна система, пізніше ми стали будувати цифрове ядро, після чого перейшли на рівень створення процесора акторів (Actor Engine). Тепер ми створили можливість об'єднувати актори в граф акторів, і Corezoid став оркестратором. Сенси безумовно збереглися, а рівень розуміння того, що будує Corezoid, якісно зріс.
Ілюстрація: Corezoid як ERP-система
gg: Як ви оцінюєте ринок чат-ботів в Україні?
Олександр Вітязь: Немає сенсу вимірювати, але в межі він дорівнює кількості живих бізнесів. Я б по-іншому питання сформулював: скільком компаніям потрібна комунікація з клієнтом? Усім. І співробітникам теж усім. Ось це відповідь на запитання про розмір ринку.
gg: І яку частку у вашій компанії займають чат-боти?
Олександр Вітязь: Давайте поміняємо слово "чат-бот" на "фронт". У роботі нашої компанії завжди є місце для "фронту", тому що "бекенд" і "мідл" повинен якось комунікувати зі споживачем і щось комусь показувати. А от який він і яка частка того чи іншого виду "фронтенду" - це вже ситуативно. Ми 100% клієнтів постачаємо цифрове ядро, хтось до нього підключає тільки чат, хтось застосунок, хтось усе одразу.
gg: Якщо IT у цій картині світу завжди пов'язані з комунікаціями, виходить, що ви глобально берете участь у процесі автоматизації всього, що можна автоматизувати?
Олександр Вітязь: Не зовсім так. Тому що наразі не все можна автоматизувати та не все потрібно. Якщо міркувати в цьому контексті, то комунікатором або месенджером можна назвати й асфальтоукладач. Адже, коли ми з вами будуємо дорогу, у людей з'являється можливість кудись їздити, наприклад, один до одного в гості та спілкуватися. Тобто дорогу ми теж можемо розглядати якоюсь мірою, як месенджер. Автоматизована вона чи ні - це вже друге питання. Десь це можна, і не шкодить комунікації. Десь - це складно.
На мої запитання той самий GPT насилу відповідає. Але якщо я буду свої запитання адресувати якомусь професору, він сьогодні відповість мені краще, ніж GPT. Поки що краще.
При цьому на запитання рівня оператора кол-центру GPT дуже пристойно відповідає вже зараз
Важливо створювати канали комунікації, легко і швидко. А от як там спілкуватися? Яка частка в них автоматизації - це питання менеджменту. Наприклад, ми сьогодні для себе вже вирішили, що на перший рівень саппорту відповідатиме GPT. А другий рівень - якщо клієнт незадоволений відповідями першого рівня (наприклад, у NPS оцінку ставить погану), ми передаємо вже на людину. Це цілком нормально.
gg: Що переважає в платформах для чат-ботів у нашій країні - Telegram або Viber?
Олександр Вітязь: Усе залежить від сегмента, десь Viber №1, десь Telegram. Тобто правильно одразу підключати всі канали та давати клієнту вибір.
gg: Якого розміру компанії до вас звертаються?
Олександр Вітязь: Взагалі будь-які. Від приватних підприємців до великих корпорацій. У найбільшого клієнта 200 мільярдів капіталізації. Підписка на corezoid.com стартує з 30 доларів на місяць.
gg: Якими скілами повинен володіти приватний підприємець, щоб користуватися Corezoid?
Олександр Вітязь: Що таке приватний підприємець? Це ж не професія. Якщо - це інженер у формі приватного підприємця, йому все зрозуміло відразу, що потрібно робити. Якщо перукар - приватний підприємець, напевно йому буде складно. Потрібні скіли інженера і навченого бізнес-аналітика. MySQL, трохи JavaScript. Можна користуватися і взагалі без цих знань, але реально чогось вартісного не зробити. Потрібен якийсь інженерний бекграунд у вигляді освіти профільної або досвіду практичної роботи. Потреба залежить від завдання, яке ви вирішуєте.
Якщо вам потрібно зробити простенького робота, звісно, інженер для цього не потрібен
Якщо якийсь складний проєкт, і алгоритмів у ньому мільйон, то без інженера найвищої кваліфікації не обійтися.
gg: З яких кроків складається розробка чат-бота?
Олександр Вітязь: Компанії потрібно знати 2 речі - мати галузеву експертизу і зайти на corezoid.com, все інше допоможемо, покажемо, навчимо, запустимо і супроводимо. Ми надаємо готовий оркестратор комунікацій (не плутати з оркестратором сервісів), він дає змогу налаштувати всі канали комунікацій: чати, пошту, голос, форми, коментарі, додати gpt, а потім керувати клієнтами, операторами, ботами, контентом і календарем подій.
gg: Які переваги надає Corezoid для створення чат-ботів?
Олександр Вітязь: Усе в одному - фронт-мідл-бек, білінг, антифрод, ШІ, CRM, платежі, навчання та видатна експертиза. За допомогою Corezoid чат-боти створені в Сінево, ПУМБ, Metro, УЗД, Ібіс і багато інших. З останніх - kai.ai - дуже корисний і перспективний проєкт психологічної допомоги.
gg: Які складнощі та ризики існують при створенні та запуску чат-бота для бізнесу?
Олександр Вітязь: Ризик є архітектурний - якщо неправильно її спроєктувати, то пластичність рішення буде низькою, а ціна доопрацювань високою.
gg: Як ви вимірюєте успіх чат-бота?
Олександр Вітязь: Звичайні бізнес-метрики: кількість клієнтів, транзакція, оцінка діалогу, NPS (індекс підтримки споживача, Net Promoter Score, методика опитування, за якою клієнта просять оцінити від 1 до 10 ймовірність того, що він порекомендує компанію своєму оточенню — примітка редакції gg). З появою Великої Мовної Моделі будемо впроваджувати непряму оцінку, наприклад за тональністю мови клієнта.
gg: Виходить, що чат-боти мають сенс, тільки якщо у тебе велика аудиторія?
Олександр Вітязь: Чат-боти - це не лише про комерцію, а й про комунікацію. Це канал зручний для клієнтів, щоб поставити запитання. Але чат-бот це все-таки формат комунікації у вигляді командного рядка. Якщо вам, наприклад, потрібно завантажити тисячу позицій, напевно, месенджер не найзручніший для цього формат.
У нашому світі чат-боти не виключають застосунки. Вони один одного доповнюють, чати викликаються з застосунку, застосунки викликаються з чату. Правильна відповідь - треба робити все, це сполучені посудини.
Для якихось експериментів, перевірок гіпотез - зрозуміло, що чат - це найдешевший канал
Швидко зібрав у "беку" алгоритм, запустив бота, подивився - як клієнти на це реагують. І тоді вже переносиш у застосунок. Як пісочниця для експериментів, MVP, чат-бот - це правильне рішення. Тому що тобі в цьому випадку не потрібно займатися "фронтом". А якщо ти робиш застосунок, то треба одразу на трьох напрямках працювати: Android, iOS, люди дорогі і все таке інше. Ціна помилки, якщо одразу ідею втілювати в додаток, напевно, від десятків тисяч доларів і місяці часу.
gg: Якщо хтось вирішив запустити чат-бот для своєї компанії, з чого б ви порадили почати?
Олександр Вітязь: Давати поради дуже легко (сміється). Якщо комусь прийшла саме ідея "запустити", то це біда. Тому що він дасть команду зробити чат-бота. Йому щось склепають, а далі починається реальне життя - доопрацювання, витрати та інші відкриття. Тобто цей чат-бот (застосунок, сайт - не важливо) постійно відвертатиме увагу, і все це одразу стає точкою витрат. А от щоб перетворити це на точку доходів, треба серйозно попрацювати й подумати. Програміст це за менеджера не зробить.
Який тут вихід? Думати, проєктувати. Якщо немає досвіду, то або кудись звертатися, або вирощувати свого фахівця. Serverless - це ж парадигма правильна. Вона, звісно, не розвинулася до правильного вигляду, так, як була задумана. Але концепція хмарного хостингу, в теорії правильна. Раніше ти обслуговував сам сервер - купував, лагодив. Плодив цих девопсів навколо. Тепер усе переїхало в хмару, але девопсів же менше, до речі, не стало. Тому що serverless у хмарах поки що не трапився. Тобто все одно я там купую сервери. Так, я їх у себе не тримаю, але все одно я мислю серверами, версіями ОС та іншими процесорами. Це велика проблема.
Але коли-небудь я не буду цими категоріями мислити. Індустрія рухається в цей бік, але поки ще не дійшла до фінішу. Я працюватиму з якоюсь базою даних або зі знаннями. І не паритися питаннями - який там процесор стоїть, сервер і скільки пам'яті я купив чи ні.
gg: Чи відомо вам щось про використання чат-ботів в Україні у сфері освіти?
Олександр Вітязь: Наші клієнти використовують чат-боти для навчання співробітників і клієнтів. Але, повторюся, навчання - це контент і алгоритми, а не фронт.
У сфері освіти у нас є феноменальний клієнт spilno.school, обов'язково почитайте куди і як вони рухаються.
gg: Як ви думаєте - чому так багато розмов про чат-боти останні роки?
Олександр Вітязь: Тому що цей досвід є у більшості користувачів месенджерів - боти є десятки років і люди до них звикли. Тому що є легенда про простий вхід в IT. Є два міфи - один про тестувальників, другий - про чат-ботів. Як легко увійшов, так легко і вийшов. Якщо ти не професіонал, то не затримаєшся в професії. Деякі бізнеси йдуть у месенджери, тому що там їхня аудиторія. Деякі йдуть, бо немає бюджету на повноцінний застосунок. Застосунки - це дорого. Це - дизайнери, iOS-розробники з величезними зарплатами тощо. Але буває так, що і гроші є, і застосунок є, але аудиторія живе в чатах - це ситуативно. У нас є клієнти, в яких у чатах більше трафіку, а є - навпаки: чат - допоміжний, а основний трафік у застосунку.
Розмови про низьку вартість входу - це спекуляція
Ось у медицину низька вартість входу існує? І це стосується будь-якої професії. Увійшов, що далі? Якщо немає здібностей, так само і вийшов. Зрозуміло, що курсам, які навчають програмування, потрібно якось себе продавати. І меседж про легкий вхід - він працює. Але це ж майже обман.
gg: А що ви тоді скажете про zero coding?
Олександр Вітязь: Zero Coding зараз уже ChatGPT робить. Чи треба вчити це в школі, якщо подібну роботу комп'ютер уже робить краще?
Я вам скажу, що ми вже кілька людей звільнили джуніорів, джаваскриптерів і дизайнерів, тому що GPT їхню роботу робить краще.
gg: Тут у нас багато спільного з журналістикою...
Олександр Вітязь: А чим програма, з точки зору мови та лінгвістики, відрізняється від тексту? І те, й інше - мова з різним синтаксисом. Текст мовою програмування - це підмножина природної мови. Тому (спрощую) GPT так легко і програмує, що це простіше, ніж освоїти натуральну мову.
Zero Coding - є як явище, але як професії його немає, на те він і Zero Coding, що ним можуть користуватися всі
Наприклад, що таке - професія інженера? Ти маєш у математиці розбиратися. Ось є професія перекладача, є - лінгвіста. Хто з них краще знається на мові? Лінгвіст. А перекладач - краще користується мовою. Питання: якщо ми говоримо, що інженер-розробник - це перекладач, тоді ми можемо викинути слово "інженер". А якщо ми кажемо, що він таки інженер, то тоді він має бути більше лінгвістом. У лінгвістиці дуже багато математики, насправді. Це і є математика, тому що це структура, дерева і все інше.
На запитання "Чи можна бути розробником без знання математики" відповідь - не можна. Прикидатися можна, що багато хто з успіхом і робив. Але я ніколи не любив ці вирази - low code і zero code, тому що за ними втрачається суть. З Corezoid тобі не треба знати якісь специфікації мови. Але ти маєш знати математику, мати предметну експертизу, щоб зробити складний алгоритм. І якщо в тебе немає ані здібностей, ані знань, ти нічого не зробиш. Тобто, простий процес - зробиш, а складний - ні.
Коли я навчався в інституті, моя професія називалася прикладна математика, інженер-математик у дипломі записано. І тоді не було ще професії програміста в чистому вигляді. Але структура цієї професії полягала в тому, що спочатку ти вчиш математику і паралельно вчишся програмувати на комп'ютері. А от професія DevOps (development & operations - методологія розробки складного програмного забезпечення, яке постійно вдосконалюється в процесі використання - примітка редакції) - це взагалі був сусідній факультет. Тому що завдання прикладного математика - зробити математичну модель, алгоритм розв'язання задачі. Для цього насправді, окрім голови, ручки та паперу, нічого не треба.
Щоб розрізняти програмістів з інженерною підготовкою і без, ринок винайшов слово кодер. Іноді в нього є непристойна приставка :-)
Безумовно, є самоучки, які опанували основи професії, але це більше виняток, ніж правило.
gg: Виходить, що розробник чат-ботів - це теж функція, але не існуюча професія?
Олександр Вітязь: За фактом на джоб сайтах вона є, але, на мою думку, - її немає, це просто один із видів робіт для програміста. Є ринок. Наприклад, якась компанія прокинулася, пише в оголошенні "Я хочу бота розробити". Якісь люди туди приходять. Коли зустрічаються некваліфіковані замовник і виконавець, то те, що вони зможуть зробити, найімовірніше, буде "не дуже".
"Розробником" чат-ботів стати легко і тому перспектив у такої "професії" немає. Це оксюморон на кшталт "користувач смартфона". Але є професія інженера, а розробка чат-ботів - один із видів робіт, яку робить інженер. Треба ставати алгоритмістом, для цього пройти хоча б початковий курс Computer Science.
gg: Яку би ви пораду дали для студентів - що їм варто вивчати зараз, щоб бути конкурентоспроможним у майбутньому?
Олександр Вітязь: Порада не змінюється протягом 20 років - вивчати математику. Наша різниця поки що між тим, що ми називаємо інтелектом штучним і природним - в емерджетності. В умінні створювати та застосовувати одні знання і породжувати інші. От сьогодні в GPT, там і близько немає інтелекту. Але ніщо не завадить йому з'явитися. Поки є ніша - з'єднувати точки в графі, створювати знання.
Перекладати як Google Translate технічне завдання на JavaScript - це ж не робота. Робота - це написати ТЗ
Наприклад, якщо раніше на вакансію джаваскрипта ми отримували на тиждень 10 відгуків, то зараз, після появи GPT, уже 200. Різниця у 20 разів. Звісно, є ще фактор і військовий, бо частина фірм закривається, переїжджає, але тренд цей посилився саме з моменту появи gpt. Зарплати поки що не падають. Фахівців початкового рівня на ринку стало більше, а потреби в них - менше. Я думаю, що для HTML-верстальника потреба вже не повернеться, скоріш за все.
gg: Виходить, програмісти в майбутньому більше займатимуться архітектурою?
Олександр Вітязь: Але вони, взагалі-то, саме так і з'явилися. Батько сьогоднішнього вибуху з великими мовними моделями, точніше, один із батьків, - Джуда Перл. Він придумав байєсівські мережі. Тобто математичний апарат, який от зараз нарешті отримав реальне втілення. Але коли він його придумав, він же формули малював. А не вночі сидів за клавіатурою і текст набирав. Він створив матапарат, який ось тільки зараз зміг реалізуватися, тому що достатньо розвинулися обчислювальні потужності.
gg: Чат-боти вже досягли піку у своєму розвитку?
Олександр Вітязь: Не досягли, навпаки, все тільки починається. Впровадження GPT дасть змогу зробити комунікацію якісно кращою, а застосування різноманітнішим.
Велика мовна модель (ВММ) + прямі знання = експертна система (ЕС)
Я більше скажу - без жодних лінгвістичних моделей у нас у кол-центрі ПриватБанку боти з 2005 року жили. І 70% клієнтів, які з ним спілкувалися, думали, що вони спілкуються з людиною. Ці роботи працювали просто за ключовими словами. Береш статистику запитань, пишеш на них відповіді, ключові слова - все прекрасно працює. Якщо людині потрібно дізнатися баланс, не треба ж професора саджати, щоб відповісти на це запитання. Так чи інакше вона в чаті напише "який у мене баланс", "який залишок". Якісь синоніми. Я коли статистику побачив, то був вражений. Велика Мовна Модель ще краще працює. Але навіть за тупої автоматизації правило Парето майже дотримувалося. Практично 80 відсотків клієнтів не розуміли, хто їм відповідає, людина чи робот.
gg: У вас у саппорті реально працює ChatGPT і відповідає не за скриптами?
Олександр Вітязь: В операторів насправді теж є скрипти. Це ж не фристайл - що хоче, те й відповідає. Є документація по продуктах, мануали, які можна погортати, FAQ усілякі, таймінги тощо. Зараз у нас є така штука, яка називається "оркестратор комунікації". До речі, для розуміння еволюції - коли ми тільки починали працювати з чатами й ботами, дуже давно, це називалося бот-платформою. Але ось уже два роки чи більше це називається в нас оркестратор комунікації. І ця еволюція назви показує, наскільки наш погляд змінився - від приватного до загального. І от сьогодні в нас штучний інтелект стоїть у цьому оркестраторі, як співробітник. І той, хто цей оркестратор налаштовує, ставить його замість реального співробітника. Причому мовну модель можна підключати будь-яку, не обов'язково GPT, - гугловську, фейсбуківську або кілька одночасно. Ту, яка буде на ринку. Клієнт заводить акаунт, вводить ключі та підключає потрібний йому інтелект.
gg: А чи немає ризику, що GPT дасть якусь відповідь, яка буде нерелевантною або взагалі завдасть шкоди?
Олександр Вітязь: Контролюйте, можна ж перевірити перед запуском, протестувати. А немає ризику, що оператор чату напише щось не те? На людину набагато більші витрати з управління всім цим господарством. Так, за роботом потрібно стежити, але й за людьми теж. Тому з точки зору управління комунікацією нічого не змінюється.
gg: Які нові можливості для чат-ботів з'явилися в останній рік?
Олександр Вітязь: Мультиканальність, ВММ, ЕС. Мультиканальність - на ринок месенджерів для бізнесу вийшли Apple, Google, WhatsApp, Viber. Це збільшило вимоги до правильної архітектури, якості, юзабіліті, дизайну і взагалі підняло планку - для того, щоб потрапити в партнери, треба дуже і дуже постаратися. ВММ дає змогу краще розуміти питання клієнтів і створювати нові продукти в месенджерах - наприклад експертні системи. Це, зі свого боку, знижує вимоги до розробників ботів - простенького ЕС-відповідача на запитання з документації за кілька хвилин може створити будь-який просунутий користувач ПК.
gg: А що змінилося з появою ChatGPT? Це вже можна назвати зміною правил гри, чи ще ні?
Олександр Вітязь: Це створює новий інтерфейс. У широкому сенсі слова. Підприємство - це якась функція, алгоритм. Міняє колеса, доставляє їжу чи ще щось, не важливо. Здійснює якусь функцію. І для того, щоб ви цю функцію вжили, вам потрібен якийсь інтерфейс. Застосунок, бот природною мовою, не природною. Форми якісь і так далі. Але наш із вами нативний інтерфейс - мова - появу великої мовної моделі дуже спрощує.
Наприклад, у банківському застосунку 500 сторінок. Додавання кожної нової фічі - це ще сторінки, люди, завдання, документація, "бекенди" та інше. А тепер уявіть: завтра додалася 501-а послуга. І ми не оновлюємо застосунок. Тому що ви цю послугу споживаєте через бота.
Інтерфейси ці не сьогодні з'явилися - Siri, ось це все. Голосові роботи IVR у кол-центрах - це ж їхні предтечі. Але в них не було великої мовної моделі, тобто Siri елементарно майже нічого не розуміла. А ще з нашим акцентом вона взагалі нічого не розуміла. Але ось саме це завдання інтерфейсу велика модель і вирішила.
Як би ви не перекрутили фразу: "молоко купи", "купи молока", "збігай за молоком", Siri зрозуміє там тільки дві фрази з десяти можливих. А велика мовна модель зрозуміє все
І зараз уже будь-який чайник їх може робити. Експертну систему якусь, наприклад, для ваших колег-початківців. Якщо у вас є інструкція, ви її даєте великій мовній моделі, і далі вона може працювати.
ВММ це наші нові очі, вуха, мова і пам'ять. Кілька років тому я говорив, що з'явиться можливість спілкуватися з майстрами минулого на основі їхніх робіт. (Але перспективи у масової появи правильних співрозмовників є: будуть Чехови в хмарах, нейромережі, побудовані на основі творів, листів та інших збережених текстів. У нас з'явиться прямий доступ до найбільших умів, тоді ви, журналісти, зможете брати будь-які інтерв'ю, і вам ніхто не відмовить, - інтерв'ю від 2019 р.).
gg: Споживачеві вона говорить якусь цитату або правильну відповідь на поставлене запитання?
Олександр Вітязь: Усе ще цікавіше - ви даєте їй підручник геометрії за сьомий клас, і вона після цього може розв'язувати задачки за сьомий клас. Йдеться вже не про буквальне розуміння, а про розуміння правил використання. І це якраз не складно. Це все одно ще не інтелект, але інтерфейс змінився якісно, тому що вам уже не треба давати жорсткі команди. Чим відрізняється натуральна мова від мови програмування? Жорсткістю синтаксису. Щоб вас розумів комп'ютер у тому вигляді, в якому він сьогодні існує, без жорсткого синтаксису не обійтися.
І звичайний програміст - це перекладач з відкритого синтаксису на жорсткий
Але хтось передає інформацію через цей синтаксис. Ось цей хтось - це і є справжній інженер. Той, хто каже, як і що зробити. У чому взагалі розрив у класичній парадигмі програмування? У тому, що product owner (власник продукту - так у розробці називають відповідального за розвиток і управління розроблюваним програмним продуктом - примітка редакції) не алгоритміст, але він, наприклад, змінює валюту. А програміст - не фінансист, і слова ф'ючерс та правил роботи ринку не знає. І от вони між собою намагаються знайти спільну мову. І це проблема. З великою мовною моделлю цей розрив ліквідується, ми всі станемо алгоритмістами та постановниками задач. Бо комп'ютер уже розуміє майже будь-яке наше повідомлення.
gg: Найближчим часом навіть у банківських застосунках ми маємо побачити якісь голосові функції?
Олександр Вітязь: Та там і раніше намагалися, але погано виходило. Для того, щоб зробити нормальне голосове управління додатків, треба було займатися тим, чим 15+ років GPT займався (я маю на увазі компанію OpenAI). І мати відповідного класу спеціалістів та фінансування. Для української компанії це нереально - мати такий бюджет і доступ до таких людей. І це стосується не тільки України, а більшості країн і компаній. Ми бачимо сьогодні, що від сили до 10 компаній у світі цим займається. Тобто їх не десятки, і тим більше не сотні. Тому що це дороге задоволення, gpt тільки на хостинг витрачає сотні тисяч доларів на добу.
gg: До речі, про нові інтерфейси. Ви ж робили додаток Приват24 для Google Glass. Як ви вважаєте - чи є майбутнє у таких окулярів, наприклад, чи зможе Apple зробити щось, що змінить світ?
Олександр Вітязь: Google свій проєкт окулярів закрила. У цих окулярів майбутнього немає. А ось у доповненої реальності майбутнє є. А ось як вона буде реалізована - питання відкрите. У більшості смартфонів автономність не дуже сьогодні, у окулярів ще гірша. Тому ми, коли приходимо кудись, одразу шукаємо зарядку. Це вже майже інстинкт.
Я не знаю, що це буде, питання не до окулярів, як таких, а до джерел живлення. Щойно вони стануть мініатюрними (або бездротовими), якась однозначна, якщо не революція, то рух у її бік, відбудеться. Автономності не вистачає. Те саме ми бачимо сьогодні як у смартфонах, так і в електромобілях, скрізь. Автомобілі точки, коли вже можна їздити (хоча ще не так, як на бензині), вже досягли.
gg: Коли хтось каже, що розробив чат-бота зі ШІ, що він насправді має на увазі?
Олександр Вітязь: До появи ВММ - без поняття, перебільшували напевно (сміється). Часто за ШІ видавали відповіді за ключовими словами. Реально сьогодні використовувати ВММ для розпізнавання запитань, створення ЕС, автоматизації роботи кол-центрів.
gg: У вас є своє бачення - як ШІ вплине на людство? Воно оптимістичне чи песимістичне?
Олександр Вітязь: Звісно є, а в кого його немає?! (сміється) По-перше, що вважати оптимістичним чи песимістичним. Ось у вас, я знаю, є коти. Питання: це ви ними керуєте чи вони вами? А тепер замість котів поставте себе. Судячи з фотографій, ваші коти щасливі.
Життя вже змінюється. Але не все можна екстраполювати. От коли людина йде в перший клас, можна екстраполювати її життя до інституту, що з нею відбуватиметься. Ну, плюс-мінус. А тепер уявіть, що ви не можете екстраполювати. Ми можемо фантазувати. Який у нас горизонт планування сьогодні? Хто планував пів року тому, що почнуться звільнення джуніорів, джаваскриптерів і операторів кол-центрів? Ніхто.
Більшість людей не працює насправді інтелектуально, вони працюють фізично
Так от фізична праця залишиться, а інтелектуальна - не у всіх. Але вона всім і не потрібна. Питання про зарплати й доходи якось вирішиться, тому що економіка нікуди не дінеться, вона трансформується разом із працею.
Книга "Монстри доктора Ейнштейна" повідомляє, що модель Всесвіту може розрахувати 100 осіб у світі, складність моделей подвоюється кожні 20 місяців. Далі проекстраполюйте самостійно.
Щомісячна активна аудиторія GPT у березні 2023 року становила близько 100 мільйонів.
Подвоїмо з поправкою на розумних, але принципових, виходить 200 млн. У світі 8 млрд осіб. Лише 2,5% людей пройшло тест на цікавість та інтелект. Безумовно, з часом кількість користувачів зросте за рахунок спрощення доступу, вбудовування у звичні інтерфейси тощо. Але в даному контексті важливий саме первинний імпульс - тільки 2,5% захотіло негайно доторкнутися до агрегованих знань усього людства. Це до питання про те, скільки людей працює головою, а скільки фізично. Практично, відбувся тест Тюрінга навпаки - комп'ютер тестує людство на інтелект.
З іншого боку роботу не потрібна кока-кола, штани, туш для вій. І коли з'явиться правильний, справжній, автономний штучний інтелект (АІІ), частина звичної нам економіки почне змінюватися.
gg: І що більше буде роботів, то більше буде потрібно людей, які будуть цих роботів створювати й обслуговувати?
Олександр Вітязь: Роботи та АІІ - це дві великі різниці. Роботи це матеріальна фізична присутність АІІ, їх потрібна нескінченна кількість. АІІ буде на старті кілька штук - за кількістю термоядерних країн, а в межі 1, у науці це називається сінглтон, There can be only one. АІІ без квантових комп'ютерів не з'явиться. АІІ дуже пов'язаний з енергетикою. По-перше, потрібно дуже багато рахувати, по-друге, обчислювачі потрібно сильно охолоджувати, по-третє, все це потрібно захищати фізично і криптографічно.
Роботи - це наступні смартфони та електроавтомобілі, основний мозок яких знаходиться в хмарі. Поки що їх обслуговують люди. Але обслуговування електромобіля і бензинового автомобіля - це дві великі різниці вже сьогодні. Колись роботи навчаться міняти болтики і колеса. Це досить очевидно, це можна легко екстраполювати. Робочі місця для тих, хто працює руками, ще будуть довго.
Усе це поступово змінить принципи економіки, тому що суть економіки - це розподіл і перерозподіл доступу до енергії.
Якщо дуже спростити, то коли запуститься термоядерний реактор, з'явиться енергетичний комунізм
Сьогодні різниця між найбіднішою країною і найбагатшою в кількості споживаних кіловатів на душу населення. Ну, або все можна привести до кіловатів. І от, якщо візьмете американську сім'ю там і який-небудь Бангладеш, то ви побачите, що різниця між ними в доступі до енергії на порядки відрізняється.
Ми дохід домогосподарства беремо ділимо на вартість кіловата, отримуємо кількість енергії для середнього американця і середнього бангладешця. Але щойно запуститься умовно нескінченне, безоплатне джерело енергії, вважайте, що настав комунізм із цього погляду. Потрібно вам 50 кіловатів на день? - Ось, беріть. Це точка перегину для біблійної економіки (в поті чола твого ...).
Класичне розуміння економіки зникне, щойно з'явиться умовно-безкоштовне джерело енергії
Вам не треба заробляти гроші для того, щоб працював холодильник. Чи опалення, чи ще щось. Дуже рекомендую книжки Вацлава Сміла, дуже концентрована їжа для розуму.
gg: І останнє запитання: як може використовувати чат-ботів медіа, наприклад, gagadget?
Олександр Вітязь: Є багато варіантів: стрим новин, опитування, робота з ком'юніті, підписка, інвойси, розміщення реклами, оголошень, мікротренінг, радіо - зараз це більше питання ідей, а не технічних можливостей - наприклад, ви можете за кілька годин налаштувати чат gpt, який даватиме змогу читачам говорити з контентом усього вашого сайту, а це вже зовсім новий досвід і для вас, і для користувачів.
Загадка від Олександра Вітязя
Наостанок загадка про автономний штучний інтелект від Олександра Вітязя: яким у цій схемі буде останнє слово? Перший, хто дасть правильну відповідь у коментарях, отримає від нього книгу «Кодекс акторів» з дарчим написом.
Для тих, хто хоче знати більше
- Валерій Яковенко (EcoFlow): ми маємо виробляти електроенергію вдома, щоб самостійно її споживати
- Дмитро Яковлєв (MacPaw): Безкоштовне надання VPN - це не втрата коштів, а наш внесок в інформаційну безпеку України
- "Через 10-12 років 90% геймерів перейде в хмарний геймінг": інтерв'ю з командою Boosteroid
- Професії майбутнього: аналітик Big Data, розповідає Сергій Бориславський (Vodafone Україна)
Останнє слово в схемі Communism?
Відповісти