• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
14.04.2017
Редакция Naked Science
1
956

Искусственный интеллект научился у людей расизму и сексизму

Анализ корпуса интернет-текстов показал, что искусственный интеллект воспринимает не только формальную структуру языка, но и языковые стереотипы.

gender_0
©Wikipedia

Принято считать, что искусственный интеллект решает задачи и делает выводы гораздо более рационально, чем человек. Компьютеры обрабатывают огромные объемы информации, их алгоритмы созданы по строгим законам логики и неподвластны эмоциям. Во многих сферах это действительно приносит результаты. Например, суперкомпьютер IBM Watson, основываясь на анализе медицинской литературы, верно поставил диагноз 90% больных раком легких, а врачи-люди во время теста справились с этим лишь в 50% случаев.

 

Однако новые исследования показывают, что и искусственный интеллект не застрахован от «человеческих» ошибок и стереотипов. Причина в том, что многие материалы, с помощью которых ИИ обучается, созданы людьми. Например, «учителями» искусственного интеллекта могут стать обычные пользователи Интернета.

 

Для чего это нужно? Одна из важнейших задач, стоящих перед системами искусственного интеллекта, заключается в том, чтобы компьютер мог воспринимать команды не только на формальных языках (таких как языки программирования), но и на естественном языке – на таком, с помощью которого люди общаются между собой. Это поможет усовершенствовать машинный перевод, работу поисковых систем, автоматическую генерацию текстов и многое другое. Для обучения систем искусственного интеллекта компьютерная лингвистика использует корпусы текстов – большие массивы текстов, подобранных и обработанных по определенным правилам. Интернет – один из самых доступных источников «живого» языка. Поэтому лингвисты активно пользуются интернет-корпусами, в которые включены тексты социальных сетей, блогов, новостных ресурсов.

 

Поиск имен, носителями которых чаще всего являются женщины. Credit: Aylin Caliskan

 

Авторы нового исследования, опубликованного в журнале Science, предположили, что искусственный интеллект не только усваивает структуру естественного языка, но и перенимает особенности семантики, исторически закрепившиеся в языке. Ученые использовали алгоритм самообучения GloVe, работающий подобно тесту подсознательных ассоциаций (implicit-association test). GloVe составляет статистику ассоциативно связанных друг с другом слов: чем чаще два слова встречаются в текстах на сравнительно небольшом расстоянии друг от друга, тем чаще они ассоциируются между собой. Алгоритм проанализировал корпус интернет-текстов из 840 млрд слов.

 

Названия цветов (роза, маргаритка) оказались связаны с положительными понятиями (ласка, любовь), а названия насекомых – с отрицательными (грязь, уродливый). Следующие выводы были не такими безобидными. Совместив корпус с базой имен, часто встречающихся у американцев европейского или африканского происхождения, ИИ выявил: европейцев обычно ассоциируют с такими понятиями, как «семья», «друг», «счастливый», а афроамериканцев – со словами «бедность», «тюрьма», «убийство». Также выяснилось, что мужские имена чаще ассоциируются с понятиями из области карьеры (профессиональный, зарплата), а женские – с семейными (материнство, свадьба).

 

Ассоциации традиционно женских имен с профессиями из списка – от редкого к частому. Credit: Aylin Caliskan

 

Исследователи показали, что системы искусственного интеллекта не просто фиксируют стереотипы, но и используют их в материалах, которые составлены самим ИИ. Например, Google Translate переводит турецкое гендерно нейтральное местоимение «о» в зависимости от профессии: «o bir doktor» – «он врач», но «o bir hemsire» – «она медсестра».

 

Недавно была создана система искусственного интеллекта, использующая стратегию эволюции. Этот подход позволил быстрее решать задачи, связанные с обучением нейронных сетей. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Вчера, 19:00
Дарья Губина

Чтобы издалека оценить обитаемость космического тела, нужно понимать, какие на нем есть молекулярные соединения и как они взаимодействуют. И вот по данным, собранным аппаратом «Юнона», ученые рассчитали движение простейших элементов на покрытой ледяной коркой Европе, спутнике Юпитера.

Позавчера, 15:15
Юлия Трепалина

Ученые давно заметили связь между уровнем образования и продолжительностью жизни людей. Новое исследование показало, что дополнительные годы учебы коррелируют не только со снижением риска смерти, но и с замедлением биологического старения.

Вчера, 14:35
Ольга Иванова

Международная группа исследователей проанализировала изменения, которые происходят в организме человека, если полностью исключить прием пищи в течение семи дней.

1 марта
Юлия Трепалина

Первого марта в России отмечают День кошек. Это одни из самых популярных домашних животных, которые живут рядом с человеком уже порядка десяти тысяч лет. Несмотря на многовековое знакомство, в общении людей и кошек хватает неясностей. Так, французские ученые недавно выяснили, что почти в трети случаев знаки кошачьего неудовольствия толковались ошибочно.

Вчера, 14:35
Ольга Иванова

Международная группа исследователей проанализировала изменения, которые происходят в организме человека, если полностью исключить прием пищи в течение семи дней.

Вчера, 19:00
Дарья Губина

Чтобы издалека оценить обитаемость космического тела, нужно понимать, какие на нем есть молекулярные соединения и как они взаимодействуют. И вот по данным, собранным аппаратом «Юнона», ученые рассчитали движение простейших элементов на покрытой ледяной коркой Европе, спутнике Юпитера.

20 февраля
Полина

В Российской академии наук завершили первый Большой словарь ударений, его издадут к концу года. Лингвисты собрали наиболее современные нормы произношения привычных слов и зафиксировали ударение для лексики, которая появилась в русском языке недавно.

15 февраля
Дарья Губина

Титан — самый органически богатый спутник с глобальным океаном в Солнечной системе. И все же, сопоставив строение его поверхности с интенсивностью падения метеоритов, ученые пришли к выводу, что в океане спутника Сатурна вряд ли хватает элементов для жизни.

22 февраля
РНФ

Ученые показали, что экстремальный подъем уровня Каспийского моря на десятки метров, произошедший 18-13 тысяч лет назад и получивший название «Великая Хвалынская трансгрессия», мог быть вызван, вопреки существующим гипотезам, не таянием ледника, а естественными изменениями палеоклимата. Оказалось, что из-за холодного климата того периода обширные территории, с которых собирали воду впадающие в Каспий реки, были покрыты многолетней мерзлотой. В результате массы дождевых и талых вод почти не впитывались в мерзлые грунты и стекали в море, испарение с поверхности которого было небольшим. Все эти факторы привели к повышению уровня Каспия и увеличению площади моря более чем вдвое по сравнению с современным. Полученные данные помогут уточнить представления о масштабе колебаний уровня Каспийского моря при изменении климата.

[miniorange_social_login]

Комментарии

1 Комментарий

алгоритмы созданы по строгим законам логики и неподвластны эмоциям
Подтвердить?
Подтвердить?
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: