The New York Times запретила использовать свой контент для тренировки генеративного искусственного интеллекта
Газета New York Times обновила условия использования, которые запрещают собирать контент компании для обучения систем машинного обучения или искусственного интеллекта.
Что известно
В обновленных условиях указано, что автоматизированные инструменты сбора контента не могут быть использованы без письменного разрешения издания. Отказ от соблюдения ограничений может повлечь за собой неуказанные штрафы или наказания, говорится в документе.
Несмотря на введение новых правил в свою политику, издание, похоже, не внесло никаких изменений в robots.txt — файл, информирующий поисковые системы о том, какие URL-адреса могут быть доступны.
Вероятно, этот шаг предпринят в ответ на недавнее обновление политики конфиденциальности Google. Поисковый гигант заявил, что может собирать открытые данные из интернета для обучения своих различных сервисов искусственного интеллекта, таких как Bard или Cloud AI.
Многие крупные языковые модели, используемые также обучаются на больших массивах данных, которые могут содержать защищенные авторским правом материалы из публичного интернета. Зачастую они собираются без разрешения правообладателей.
Источник: The Verge