Новий AI-агент від OpenAI зможе забронювати квитки, замовити їжу і виконати інші завдання на сайтах замість користувачів

OpenAI презентувала новий AI-агент Operator, який здатен виконувати завдання в Інтернеті за користувачів.
Що відомо
Агент використовує власний браузер, щоб переглядати вебсторінки, натискати на кнопки, вводити текст і прокручувати контент. Це дозволяє йому виконувати завдання в Інтернеті, як людина, яка самостійно натискає кнопки, прокручує сторінки та вводить текст на сайтах. Спочатку новинка буде доступна тільки для підписників ChatGPT Pro в США.
Operator працює на спеціальній моделі, яка поєднує можливості GPT-4o з поглибленим навчанням. Це дозволяє йому не просто "бачити" сторінки через знімки екрана, але й взаємодіяти з інтерфейсами, як ми звикли це робити мишкою та клавіатурою.
Найцікавіше, що агент не просто виконує завдання, а й може самокоригуватися. Якщо щось піде не так, він дасть вам контроль над процесом. А ще він обов’язково попросить дозволу, якщо сайт потребує чутливої інформації (наприклад паролів) або запитає вашу згоду перед тим, як відправити лист.
OpenAI співпрацює з популярними компаніями, як-от Uber, DoorDash, Instacart та іншими, щоб агент виконував реальні завдання, дотримуючись норм безпеки та етики. Однак не все працює ідеально — складні інтерфейси типу створення слайд-шоу поки що даються йому важко.
Вже найближчим часом Operator з’явиться для користувачів Plus, Team та Enterprise планів, а OpenAI планує інтегрувати цю технологію прямо в ChatGPT.
Джерело: OpenAI