Новый AI-агент от OpenAI сможет забронировать билеты, заказать еду и выполнить другие задачи на сайтах вместо пользователей

Автор: Анастасия Бобкова, 24 января 2025, 08:21
OpenAI представляет AI-агента, который будет выполнять действия на сайтах за вас OpenAI запускает AI-агента, который сделает все за пользователей на сайтах: кликает, вводит текст и даже ищет нужную информацию. Источник: OpenAI

OpenAI представила новый AI-агент Operator, который способен выполнять задачи в Интернете за пользователей.

Что известно

Агент использует собственный браузер, чтобы просматривать веб-страницы, нажимать на кнопки, вводить текст и прокручивать контент. Это позволяет ему выполнять задачи в Интернете, как человек, который самостоятельно нажимает кнопки, прокручивает страницы и вводит текст на сайтах. Сначала новинка будет доступна только для подписчиков ChatGPT Pro в США.

Operator работает на специальной модели, которая сочетает возможности GPT-4o с углубленным обучением. Это позволяет ему не просто "видеть" страницы через снимки экрана, но и взаимодействовать с интерфейсами, как мы привыкли это делать мышкой и клавиатурой.

Самое интересное, что агент не просто выполняет задание, но и может самокорректироваться. Если что-то пойдет не так, он даст вам контроль над процессом. А еще он обязательно попросит разрешения, если сайт требует чувствительной информации (например паролей) или спросит ваше согласие перед тем, как отправить письмо.

OpenAI сотрудничает с популярными компаниями, такими как Uber, DoorDash, Instacart и другими, чтобы агент выполнял реальные задачи, соблюдая нормы безопасности и этики. Однако не все работает идеально - сложные интерфейсы, типа создания слайд-шоу, пока даются ему с трудом.

Уже в ближайшее время Operator появится для пользователей Plus, Team и Enterprise планов, а OpenAI планирует интегрировать эту технологию прямо в ChatGPT.

Источник: OpenAI

Подписывайтесь на наш нескучный канал в Telegram, чтобы ничего не пропустить.