Контракты Microsoft – тяжелый и низкооплачиваемый труд. Последняя утечка документов

Автор: Дэн Серов, 19 августа 2019, 10:41

Последняя утечка данных показала, что работники Microsoft получают от $12 до $14 в час и должны обрабатывать по 200 аудиоклипов за это время для тренировки ассистента Cortana.

Apple, Google, Amazon и совсем недавно Facebook были замечены за использованием человеческого труда для расшифровки аудиозаписей своих же продуктов. Как сообщает Motherboard, Microsoft делает то же самое для Skype несмотря на то, что многие компании отказываются от подобной рабочей силы.

Недавняя утечка данных, замеченная Motherboard, показывает закулисье разработки искусственного интеллекта IT-гигантами: наемные работники репитативно изучают данные приложений для улучшения качества распознавания речи. Это значит, что многообещающие приложения по работе с людской речью немыслимы без монотонного человеческого труда.

Объем работ многократно увеличивается из-за широкой интеграции Cortana в совершенно разные устройства: это и Windows 10, и Xbox One, и мобильные ОС. «Я делал чертовски много расшифровок и аннотаций команд Cortana в рамках своей работы на Microsoft”, говорит один из наемных рабочих корпорации. Motherboard гарантировала респонденту анонимность для более откровенного диалога о внутренних делах компании; более того, источник подписывал договор о неразглашении.

Инструкция для внутреннего пользования содержит сотни страниц, включая особые требования к классификации информации и пунктуации. Источник сообщает, что работникам Microsoft необходимо обрабатывать по 200 голосовых фрагментов в час. Более того, в таких фрагментах сравнительно часто попадается личная и интимная информация.

Оплата за такой труд разнится в небольших пределах: один контракт говорит о $12 в час с возможностью получить дополнительный доллар в качестве бонуса, контракт для похожего типа работ подразумевает о $14 с таким же ничтожным бонусом.

Целая секция материалов посвящена фразе “Привет, Cortana”, в особенности ее произношение с разными акцентами и на разных языках, включая немецкий, китайский, японский, а также различные диалекты английского.

В редакцию Motherboard поступило письмо следующего содержания: «Мы всегда стараемся сделать наши дела прозрачными и помочь клиентам с выбором. Мы всегда сообщаем, что используем данные пользователей для улучшения наших продуктов, а также задействуем третьих лиц для помощи в этом, при этом максимально анонимизируя данные».

Сразу после публикации Motherboard новости о том, что люди прослушивают пользовательские звонки с применением функции встроенного переводчика, Microsoft обновила политику конфиденциальности и включила туда пункт о третьих лицах.

Что касается самой работы третьих лиц, то их главной задачей является классификация данных. От работников требовалось распределение расшифровок по темам. Всего их более двадцати, включая: «Календарь», «Будильник», «Камера», каждая из которых отвечает за свои одноименные функции. Другие темы включают в себя игры, e-mail, связь, фидбек, «умный дом», а также «Заказ еды», найденный в документах Microsoft. Тема «общие» предназначена для расшифровок, подходящих под несколько категорий.

У каждой темы или «домена» свои функции: включение\выключение и настройка будильника, настройка и включение таймера – это то, что касается домена «будильник».

Основной задачей работников как раз и является распределение информации по таким категориям. Но другой документ показывает, что категории меняются очень часто, снова и снова добавляя людям работы.

Источник: Motherboard