Еволюція лінійної логіки: чому ваш мозок та нейромережі чують однаково

Автор: Петро Тітаренко | сьогодні, 13:11

Поки ми сперечаємося, чи замінить штучний інтелект людину, вчені з Колумбійського університету (Columbia University) та IBM Research з’ясували, що ми вже давно працюємо за схожими схемами. Принаймні, коли йдеться про розпізнавання мови. Дослідники порівняли внутрішні стани рекурентних нейромереж (RNN) з активністю мозку живих людей і виявили дивовижну схожість, яка натякає: природа та математика прийшли до одного й того самого ефективного рішення незалежно одна від одної.

Експеримент на відкритому мозку

Для цього дослідження науковцям знадобилося щось більше, ніж просто МРТ-сканер. Вони залучили 15 пацієнтів з епілепсією, яким за медичними показаннями вже були імплантовані електроди безпосередньо в слухову кору. Це дало змогу фіксувати електричну активність нейронів з точністю, недоступною для зовнішніх датчиків. Пацієнти протягом 30 хвилин слухали розповіді, поки вчені записували реакцію їхнього мозку.

Паралельно ту саму аудіодоріжку «згодовували» рекурентній нейромережі, навченій розпізнавати мову. IBM Research та їхні колеги аналізували, як змінюється інформація на кожному етапі — від вхідного сигналу до фінального розуміння сенсу. Виявилося, що обидві «системи» проходять майже ідентичну ієрархічну драбину: спочатку виділяються базові акустичні ознаки, потім фонетичні елементи, далі слова і, нарешті, складні смислові конструкції.

Від вібрацій до філософії

Важливий нюанс полягає в тому, що по мірі просування шарами нейромережі інформація топографічно відповідала ієрархії обробки в корі людини. Тобто початкові шари ШІ корелювали з первинною слуховою зоною, а глибші — з областями, що відповідають за розуміння мови. Це свідчить про те, що оптимальний шлях від «шуму в вухах» до «ідеї в голові» — штука досить універсальна.

Цікаво, що така схожість виникала лише тоді, коли алгоритм навчався на конкретній мові. Як і людський мозок, що освоює рідну мову, ШІ структурує свої «знання» залежно від лінгвістичного контексту. Якщо підсунути мережі, навченій англійської, китайську мову — магії не станеться. Це ще раз підкреслює, що ми маємо справу не просто з математичним збігом, а з фундаментальним принципом обробки мовної інформації.

Чому стара добра рекурентність краща за трансформери

Автори роботи окремо наголосили, що для порівняння обрали саме RNN (Recurrent Neural Networks), а не сучасні трансформери, на яких базуються популярні чат-боти. Сучасні архітектури часто обробляють текст або звук цілими блоками, «бачачи» все одразу. Мозок так не вміє — він обробляє потік інформації послідовно, крок за кроком. Саме поетапність RNN дозволила провести прямі паралелі з біологічними процесами.

Це дослідження відкриває двері до використання ШІ як «прозорої моделі» мозку. Замість того, щоб проводити складні інвазивні операції на людях, вчені зможуть тестувати гіпотези на нейромережах, які працюють за схожими принципами. Проте залишаються питання без відповідей. Наприклад, чому людська мова асиметрична і «живе» переважно в лівій півкулі, тоді як ШІ зазвичай не демонструє такої спеціалізації зон. У майбутньому вчені планують з'ясувати, як мозок та алгоритми справляються з другою мовою та чи можна за допомогою цих моделей лікувати порушення мовлення.

Поки одні компанії намагаються навчити алгоритми думати, інші, як-от Meta, укладають угоди з медіа, щоб просто зробити відповіді своїх моделей більш точними та людяними за рахунок якісних даних.