Новый AI-агент от OpenAI сможет забронировать билеты, заказать еду и выполнить другие задачи на сайтах вместо пользователей
OpenAI представила новый AI-агент Operator, который способен выполнять задачи в Интернете за пользователей.
Что известно
Агент использует собственный браузер, чтобы просматривать веб-страницы, нажимать на кнопки, вводить текст и прокручивать контент. Это позволяет ему выполнять задачи в Интернете, как человек, который самостоятельно нажимает кнопки, прокручивает страницы и вводит текст на сайтах. Сначала новинка будет доступна только для подписчиков ChatGPT Pro в США.
Operator работает на специальной модели, которая сочетает возможности GPT-4o с углубленным обучением. Это позволяет ему не просто "видеть" страницы через снимки экрана, но и взаимодействовать с интерфейсами, как мы привыкли это делать мышкой и клавиатурой.
Самое интересное, что агент не просто выполняет задание, но и может самокорректироваться. Если что-то пойдет не так, он даст вам контроль над процессом. А еще он обязательно попросит разрешения, если сайт требует чувствительной информации (например паролей) или спросит ваше согласие перед тем, как отправить письмо.
OpenAI сотрудничает с популярными компаниями, такими как Uber, DoorDash, Instacart и другими, чтобы агент выполнял реальные задачи, соблюдая нормы безопасности и этики. Однако не все работает идеально - сложные интерфейсы, типа создания слайд-шоу, пока даются ему с трудом.
Уже в ближайшее время Operator появится для пользователей Plus, Team и Enterprise планов, а OpenAI планирует интегрировать эту технологию прямо в ChatGPT.
Источник: OpenAI