Gemini замість метеоролога: як Google вчить ШІ передбачати повені за допомогою новин
Поки більшість користувачів просить чат-ботів написати код або чергове привітання для родичів, Google Research знайшла для Gemini значно корисніше заняття. Компанія навчила свою мовну модель аналізувати мільйони новинних архівів, щоб створити глобальну систему прогнозування раптових повеней. Виявляється, старі репортажі про затоплені вулиці — це не просто архівний пил, а цінне джерело даних для навчання нейромереж.
Groundsource: коли новини стають цифрами
Проблема багатьох регіонів світу полягає не у відсутності дощу, а у відсутності датчиків. Побудувати мережу метеорологічних радарів — задоволення дороге та технічно складне. Google вирішила піти іншим шляхом, використавши Gemini для обробки понад 5 мільйонів новинних статей за останні десятиліття. ШІ витягнув із текстів дані про 2.6 мільйона конкретних випадків повеней, створивши відкритий геоприв’язаний набір даних під назвою Groundsource.
За словами менеджера Google Research Гіли Лойк (Gila Loik), це перший досвід застосування великих мовних моделей (LLM) для завдань такого масштабу в гідрології. Замість того, щоб покладатися лише на фізичні моделі річкових басейнів, система вчиться на реальному досвіді людства, зафіксованому в медіа. Це дозволяє заповнити прогалини там, де історичні метеоархиви просто не велися.
Нейромережі проти стихії
На базі Groundsource команда навчила нейромережу архітектури LSTM (Long Short-Term Memory). Цей тип алгоритмів чудово справляється з послідовностями даних, що критично важливо для аналізу погодних явищ у часі. Модель зіставляє глобальні прогнози погоди з накопиченими історичними даними про те, як конкретні ландшафти реагують на надмірні опади.
Результати вже інтегровані в платформу Flood Hub, яка тепер відображає ризики для міських територій у 150 країнах. Система передає дані екстреним службам, що дозволяє виграти дорогоцінний час для евакуації. Антониу Жозе Белеза (António José Beleza) з Південноафриканського співтовариства розвитку підтвердив, що такий підхід прискорив реакцію на загрози в регіонах, де раніше доводилося діяти майже наосліп.
Точність та майбутні перспективи
Звісно, ШІ поки не може повністю замінити професійні метеорологічні станції. Наразі модель працює з роздільною здатністю 20 км², що поступається системам Національної метеослужби США, які використовують локальні радари. Проте «інноваційний» метод Google не потребує мільярдних вкладень в інфраструктуру «тут і зараз». Його головна перевага — можливість працювати в країнах, де немає розвиненої мережі датчиків.
У Google планують не зупинятися на повенях. Аналогічний підхід до витягування кількісних даних із текстів за допомогою LLM хочуть застосувати для прогнозування інших стихійних лих:
- аномальної спеки;
- зсувів ґрунту;
- лісових пожеж.
Це перетворює Gemini з дорогої іграшки на реальний інструмент глобальної безпеки. Хоча іронічно, що для порятунку майбутнього ШІ доводиться перечитувати мільйони новин про помилки минулого.
До речі, Google активно вчить свої моделі самостійності не лише в прогнозах. Нещодавно компанія навчила ШІ домовлятися без «наглядача», що в майбутньому може дозволити системам прогнозування стихійних лих координувати дії рятувальних підрозділів без участі людини.

