Українська версія gg виходить за підтримки маркетплейсу Allo

Еволюція на стероїдах: ШІ Evo 2 навчився «читати» ДНК мільйонами знаків

Автор: Анрі Сергіїв | Оновлено сьогодні, 17:26
Візуалізація структури ДНК та роботи ШІ Evo 2 – новий крок у боротьбі з суперінфекціями та дослідженні генетики. Джерело: AI

Поки масовий глядач розважається генерацією картинок та суперечками з чат-ботами, у лабораторіях відбувається значно цікавіша тиха революція. Команда з інституту Arc Institute, Nvidia, Стенфордського та Каліфорнійського університетів представила Evo 2 — нейромережу, яка розуміє мову життя краще за будь-якого біолога-експериментатора. Це не просто черговий алгоритм, а повноцінна фундаметальна модель, навчена на ДНК понад 128 000 видів істот.

Мільйон літер у вікні контексту

Головна проблема попередніх спроб навчити ШІ генетиці полягала у короткій «пам'яті». Генетичні послідовності — це неймовірно довгі тексти, і щоб зрозуміти логіку складного організму, потрібно бачити картину цілісно. В основі Evo 2 лежить архітектура StripedHyena 2, яка дозволяє обробляти послідовності довжиною до мільйона нуклеотидів одночасно. Це величезний стрибок у порівнянні з першою версією, що дозволяє ШІ бачити взаємозв'язки, які раніше губилися у фрагментарних даних.

Для навчання моделі використали масив даних обсягом 9.3 трлн нуклеотидів. Це у 30 разів більше, ніж було у розпорядженні Evo 1. У цей «коктейль» потрапили геноми бактерій, архей, вірусів, рослин та, звісно, людини. Завдяки такому масштабу Arc Institute створили інструмент, здатний не лише аналізувати наявне, а й проєктувати нові генетичні послідовності для всіх доменів життя.

Діагностика та синтетична біологія

Практичне застосування Evo 2 виглядає переконливо навіть для скептиків. У тестах на мутації гена BRCA1, пов'язаного з ризиком раку, модель показала точність понад 90%. Вона чітко розрізняє патогенні зміни від нешкідливих варіантів, що може радикально змінити швидкість та якість медичної діагностики. Крім того, ШІ вже випробували для оцінки ризиків хвороби Альцгеймера та аналізу генетики домашніх тварин.

Особливий інтерес викликає здатність моделі проєктувати синтетичні бактеріофаги. Це віруси, які вбивають бактерії, і вони можуть стати нашою головною зброєю проти суперінфекцій, що не піддаються антибіотикам. Важливо, що розробники інтегрували Evo 2 у платформу Nvidia BioNeMo, зробивши її повністю відкритою для наукової спільноти. Весь код, ваги та навчальні дані доступні публічно, що робить цей проєкт найбільшим відкритим внеском у сучасну біоінформатику.

Етика та цифрові запобіжники

Коли мова йде про ШІ, здатний «писати» геноми, питання безпеки виникають автоматично. Розробники зі Стенфорда та Arc Institute підійшли до цього серйозно: з навчальної вибірки свідомо виключили патогени, небезпечні для людини та складних організмів. Модель просто не навчена працювати з «біологічною зброєю» і не видає відповідей на запити, що стосуються створення небезпечних вірусів. Це приклад відповідального підходу, де потужність технології спрямована виключно на лікування та дослідження, а не на створення нових проблем для людства.

Поки біологи працюють із фундаментальними кодами життя, розробники споживчих сервісів теж не стоять на місці: наприклад, ChatGPT тепер чує музику завдяки прямій інтеграції сервісу Shazam у чат-бот.

Читайте gg українською у Telegram