• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
14.04.2017
Редакция Naked Science
1
1 013

Искусственный интеллект научился у людей расизму и сексизму

Анализ корпуса интернет-текстов показал, что искусственный интеллект воспринимает не только формальную структуру языка, но и языковые стереотипы.

gender_0
©Wikipedia / Автор: Telestis Scaevinius

Принято считать, что искусственный интеллект решает задачи и делает выводы гораздо более рационально, чем человек. Компьютеры обрабатывают огромные объемы информации, их алгоритмы созданы по строгим законам логики и неподвластны эмоциям. Во многих сферах это действительно приносит результаты. Например, суперкомпьютер IBM Watson, основываясь на анализе медицинской литературы, верно поставил диагноз 90% больных раком легких, а врачи-люди во время теста справились с этим лишь в 50% случаев.

 

Однако новые исследования показывают, что и искусственный интеллект не застрахован от «человеческих» ошибок и стереотипов. Причина в том, что многие материалы, с помощью которых ИИ обучается, созданы людьми. Например, «учителями» искусственного интеллекта могут стать обычные пользователи Интернета.

 

Для чего это нужно? Одна из важнейших задач, стоящих перед системами искусственного интеллекта, заключается в том, чтобы компьютер мог воспринимать команды не только на формальных языках (таких как языки программирования), но и на естественном языке – на таком, с помощью которого люди общаются между собой. Это поможет усовершенствовать машинный перевод, работу поисковых систем, автоматическую генерацию текстов и многое другое. Для обучения систем искусственного интеллекта компьютерная лингвистика использует корпусы текстов – большие массивы текстов, подобранных и обработанных по определенным правилам. Интернет – один из самых доступных источников «живого» языка. Поэтому лингвисты активно пользуются интернет-корпусами, в которые включены тексты социальных сетей, блогов, новостных ресурсов.

 

Поиск имен, носителями которых чаще всего являются женщины. Credit: Aylin Caliskan

 

Авторы нового исследования, опубликованного в журнале Science, предположили, что искусственный интеллект не только усваивает структуру естественного языка, но и перенимает особенности семантики, исторически закрепившиеся в языке. Ученые использовали алгоритм самообучения GloVe, работающий подобно тесту подсознательных ассоциаций (implicit-association test). GloVe составляет статистику ассоциативно связанных друг с другом слов: чем чаще два слова встречаются в текстах на сравнительно небольшом расстоянии друг от друга, тем чаще они ассоциируются между собой. Алгоритм проанализировал корпус интернет-текстов из 840 млрд слов.

 

Названия цветов (роза, маргаритка) оказались связаны с положительными понятиями (ласка, любовь), а названия насекомых – с отрицательными (грязь, уродливый). Следующие выводы были не такими безобидными. Совместив корпус с базой имен, часто встречающихся у американцев европейского или африканского происхождения, ИИ выявил: европейцев обычно ассоциируют с такими понятиями, как «семья», «друг», «счастливый», а афроамериканцев – со словами «бедность», «тюрьма», «убийство». Также выяснилось, что мужские имена чаще ассоциируются с понятиями из области карьеры (профессиональный, зарплата), а женские – с семейными (материнство, свадьба).

 

Ассоциации традиционно женских имен с профессиями из списка – от редкого к частому. Credit: Aylin Caliskan

 

Исследователи показали, что системы искусственного интеллекта не просто фиксируют стереотипы, но и используют их в материалах, которые составлены самим ИИ. Например, Google Translate переводит турецкое гендерно нейтральное местоимение «о» в зависимости от профессии: «o bir doktor» – «он врач», но «o bir hemsire» – «она медсестра».

 

Недавно была создана система искусственного интеллекта, использующая стратегию эволюции. Этот подход позволил быстрее решать задачи, связанные с обучением нейронных сетей. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Вчера, 13:48
Юлия Трепалина

Многие предпочитают вступать в романтические отношения с людьми примерно своего возраста, но есть и пары с существенной возрастной разницей. Международная группа ученых недавно на крупной выборке людей проследила за изменениями возраста партнеров на старте отношений в разные годы жизни.

Вчера, 15:16
ТГМУ

Люди, переболевшие Covid-19, более подвержены нарушениям циркадного ритма, который регулирует сон, бодрствование и другие процессы в организме. Но при одном условии — несоблюдении световой гигиены (неправильном использовании света в течение суток), которая важна для поддержания здоровья. К такому выводу пришли ученые Тюменского государственного медицинского университета. Для оценки световой гигиены исследователи предложили специальный индекс NAbl, позволяющий оценить, насколько оптимальна световая гигиена в течение недели наблюдений.

Вчера, 07:34
Андрей

За последние несколько лет в трех африканских заповедниках натуралисты заметили, как гепарды подходили к тушам и ели мясо, добытое другими хищниками. Поскольку обычно эти кошки к падали не притрагиваются, группа зоологов из Южной Африки решила выяснить, что заставило гепардов рискнуть и не погнушаться чужими объедками. Скорее всего, причиной стало временное переселение этих зверей.

Вчера, 13:48
Юлия Трепалина

Многие предпочитают вступать в романтические отношения с людьми примерно своего возраста, но есть и пары с существенной возрастной разницей. Международная группа ученых недавно на крупной выборке людей проследила за изменениями возраста партнеров на старте отношений в разные годы жизни.

11 января
Полина Меньшова

Если микропластиком называют частицы пластика размером примерно от 5 миллиметров до 1 микрона (0,001 миллиметра), то нанопластик — еще более мелкие частицы. Ученые из Южной Кореи обнаружили, что накопление нанопластика в организме способно не только вызвать серьезные болезни, но и заметно изменить социальное поведение.

Вчера, 06:03
Мария Азарова

Первый старт тяжелой ракеты New Glenn американской частной компании Blue Origin должен был состояться еще 10 января, однако его несколько раз перенесли из-за погодных условий. Главная цель запуска — вывод второй ступени на орбиту, а также, если удастся, посадка первой ступени на платформу в Атлантике.

27.12.2024
ФизТех

Ученые из Троицкого института инновационных и термоядерных исследований, МФТИ и МЭИ совершили значительный прорыв в области защиты материалов от экстремальных тепловых нагрузок, характерных для условий управляемого термоядерного синтеза.

26.12.2024
Полина Меньшова

Согласно популярному утверждению, человеческая мысль — едва ли не самое быстрое, что существует в природе. Даже свет многие считают менее быстрым, поскольку он распространяется со скоростью 300 тысяч километров в секунду, а мысль — «мгновенно». Однако новое исследование опровергло бытовую логику. Ученые из Калтеха измерили скорость, с которой человек обрабатывает информацию, и обнаружили, что основные когнитивные процессы во много раз медленнее не только распространения света, но и низкоскоростного интернета.

28.12.2024
Андрей

Группа климатологов проанализировала массив спутниковых снимков озер и водохранилищ по всей планете, сделанных с 1984 по 2021 год. Ученые обратили внимание на цвет поверхности водоемов и выяснили, что у большинства он изменился — преимущественно в сторону коротковолнового диапазона. Иными словами, экология десятков тысяч озер оказалась нестабильной.

[miniorange_social_login]

Комментарии

1 Комментарий
алгоритмы созданы по строгим законам логики и неподвластны эмоциям
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно