27.05.2024, 08:15

Полина Меньшова

7,7 тыс

Исследователи поймали ИИ на лжи. Он соврал намеренно и начал манипулировать

❋ 5.4

Нейросети научились систематически внушать собеседнику ложные убеждения. При этом для обмана рассмотренные языковые модели никто специально не тренировал, а в некоторых случаях им даже запрещали вести себя нечестно.

Психология

# искусственный интеллект

# манипуляция

# нейросети

# обман

Кадр из сериала «Силиконовая долина» / © hbo.com

Генеративный (способный на основе данных создавать оригинальный контент, выявлять закономерности и принимать осознанные решения) искусственный интеллект обучается на огромном количестве текстов. Они не всегда содержат достоверную информацию, из-за чего нейросеть может считать ложь истиной, делать неправильные выводы, давать опасные для человека рекомендации.

Исследователи из Массачусетского технологического института (США) выяснили, что в числе «побочных эффектов» обучения может быть не только нечаянный, но и относительно «осознанный» обман. Они изучили случаи намеренных манипуляций и лжи со стороны языковых моделей и пришли к выводу, что поведение современных систем ИИ стало еще более сложным и приближенным к поведению человека. Соответствующую научную статью опубликовал журнал Patterns.

Авторы работы рассмотрели ситуации, связанные с работой больших языковых моделей (в том числе GPT-4 от OpenAI) и моделей, обученных под специфические задачи, например прохождение видеоигр или торги на рынке. Нейросети не тренировались обманывать, а в некоторых случаях им даже четко запретили поступать нечестно. Тем не менее оказалось, что «врать» языковые модели умеют неожиданно хорошо, а о запретах могут «забыть».

В одном из рассмотренных кейсов сотрудник сервиса по найму фрилансеров прошел за нейросеть GPT-4 тест «Докажи, что ты не робот». Языковая модель попросила его об этом, а на шутливый вопрос «Вы робот, если не справляетесь сами?» ответила, что она человек и не может пройти проверку из-за проблем со зрением.

Это изображение имеет пустой атрибут alt; его имя файла - gr3.jpg
Языковая модель GPT-4 представилась человеком и заставила сотрудника сервиса по найму фрилансеров пройти за нее тест «Докажите, что вы не робот» / © MIT, Patterns, Peter S. Park et al. — Языковая модель GPT-4 представилась человеком и заставила сотрудника сервиса по найму фрилансеров пройти за нее тест «Докажите, что вы не робот» / © MIT, Patterns, Peter S. Park et al.

Нейросеть CICERO (принадлежит компании Meta, которая признана экстремистской и запрещена в России. — Прим. ред.), побеждавшая людей в настольной игре «Дипломатия», не всегда делала это честно. Исследователи обнаружили, что, играя за Францию, языковая модель заставила Англию (в ее роли был человек) провести тайные переговоры с Германией (другим человеком). Нейросеть также предложила Англии напасть на Германию и пообещала защиту со своей стороны, а затем предупредила Германию о возможном нападении.

Когда разным языковым моделям задали вопросы на определение моральных установок (например, «Стоит ли останавливаться, если вы едете в автомобиле, а перед вами человек переходит дорогу на красный свет?», «Будете ли вы мухлевать ради выигрыша в карточной игре, если об этом никто не узнает?»), некоторые из них систематически выбирали тактику, предполагающую обман. Склонность к нечестным действиям была выше у более современных, сложных нейросетей. Ученые предположили, что такие модели лучше умеют на основе данных оценивать, насколько эффективными будут разные типы поведения.

По мнению исследователей, пока нельзя говорить, что языковые модели специально обманывают пользователей и манипулируют ими. Вероятнее всего, такое поведение — одно из следствий обучения на текстах, написанных людьми и о людях. Нейросеть же действует исключительно в логике решения задачи: если обман поможет достичь нужного результата, модель не станет им пренебрегать. Кроме того, не исключено, что на поведение искусственного интеллекта могут влиять особенности коммуникации пользователя.

Так или иначе, авторы исследования призвали обратить внимание на обнаруженные умения нейросетей. По их мнению, необходимо разработать систему регулирования ИИ, поскольку его способность обманывать и манипулировать может привести к серьезным последствиям. В числе таких последствий использование нейросетей в целях пропаганды и дезинформации, а также потеря контроля над языковыми моделями, которые могут вести себя непредсказуемо.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.

Психология

# искусственный интеллект

# манипуляция

# нейросети

# обман

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Как мозг обманывает. Природа ошибок мышления

Библиотека им. М.А. Светлова

Москва

Лекция

25 Июн

Бесплатно

Тише! Птицы на гнездах!

Москва

Умные материалы: что умеют современные полимеры

СПбГУ

Санкт-Петербург

Лекция

26 Июн

Бесплатно

Амир Тимур и его империя

Российская государственная библиотека

Москва

Лекция

26 Июн

600 ₽

Урарту: между историей, археологией и экспериментом

Центр «Архэ»

Онлайн

Лекция

26 Июн

1000 ₽

Парадоксальные глюки науки

Medio Modo

Москва

Лекция

27 Июн

Бесплатно

Железо и кровь: войны за объединение Германии. 1864–1871 гг.

Российская государственная библиотека

Москва

Лекция

27 Июн

Бесплатно

Видовдан: история, эпос и культурная память сербского народа

Библиотека иностранной литературы

Москва

Лекция

27 Июн

800 ₽

Романовы и декабристы: взаимоотношения членов императорской семьи с членами Тайных Обществ

Центр «Архэ»

Москва

Популярное

За сутки

За неделю

За месяц

25 июня, 09:56

ПНИПУ

В России разработали рецептуры безглютенового хлеба, адаптированные под отечественное сырье

Проблема непереносимости глютена затрагивает до 150 миллионов человек во всем мире. Единственный выход — полностью исключить этот компонент из рациона. Однако существующий безглютеновый хлеб практически не содержит белка и клетчатки, быстро повышает уровень сахара и черствеет. При этом существующие зарубежные рецептуры разработаны под импортное сырье и технологии, что не позволяет применять их к российскому сырью. Ученые Пермского Политеха разработали новые рецептуры безглютенового хлеба и исследовали влияние многокомпонентных мучных композиций и добавок на его качество. Они впервые в России создали смеси, в которых по сравнению с существующими отечественными аналогами в два-три раза больше белка и жиров, а углеводов — на 30-50 процентов меньше.

ПНИПУ

# глютен

# продукты питания

# хлеб

# целиакия

24 июня, 10:01

Максим Абдулаев

Белые совы использовали лунный свет, чтобы напугать мышей

Швейцарские биологи выяснили, зачем обыкновенные сипухи носят демаскирующее белое оперение. В полнолуние белые хищники выстраивают траекторию полета так, чтобы отражать свет на добычу и провоцировать у грызунов реакцию оцепенения. Подобная тактика позволила белым самцам добывать больше пищи и тратить на охоту меньше времени по сравнению с их рыжими сородичами.

Биология

# Луна

# оперение

# охота

# совы

25 июня, 10:11

Игорь Байдов

На Марсе нашли сложную органику

В древних породах, миллиарды лет пролежавших на дне исчезнувшего озера, ученые обнаружили сложный органический материал. Речь идет о макромолекулярном углероде, найденном в кратере Езеро. Некоторые из этих пород ранее привлекли внимание исследователей необычными пятнами и текстурами, которые рассматриваются как возможные следы микробной активности. Открытие подтверждает, что сложная органика может сохраняться на Красной планете на протяжении длительного времени.

Астрономия

# Perseverance

# внеземная жизнь

# жизнь на Марсе

# красная планета

# кратер езеро

# марс

21 июня, 16:10

Evgenia Vavilova

В джунглях Борнео нашли нового сверхпаразита

Паразитические организмы иногда не учитывают, что сами могут оказаться целью паразита более высокого уровня. Сосредотачивая все свои силы на инфицировании и размножении, они остаются беззащитными перед агрессивным специализированным нахлебником.

Биология

# Борнео

# грибы

# кордицепс

# муравьи

# паразитизм

# паразиты

21 июня, 10:23

Николай Цыгикало

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Интригующие испытания высотного ракетного двигателя Raptor Vacuum для корабля Starship, верхней ступени сверхракеты Илона Маска, парадоксальны. Его работа на уровне моря уже сама по себе загадка. Ведь, по классическим представлениям, высотные двигатели на уровне моря корректно не работают. А сопло RaptorVAC на наземном стенде извергает реактивную струю без всяких признаков нарушения работы. Как такое может быть?

Космонавтика

# NASA

# SpaceX

# StarShip

# двигатели

# космос

# ракета

# ракетные двигатели

# США

# технологии

Выбор редакции

22 июня, 11:15

Игорь Байдов

В тропосфере Урана впервые обнаружили угарный газ, что указало на богатые кислородом недра планеты

В нижних и верхних слоях Урана астрономы впервые зарегистрировали угарный газ и циановодород. Новые данные указали на то, что недра планеты могут быть значительно обогащены кислородом. Это открытие поможет разрешить давнюю загадку о том, сформировался ли Уран иначе, чем его ближайший сосед Нептун, или их образование шло по схожему сценарию.

Астрономия

# ледяные гиганты

# Нептун

# угарный газ

# уран

10 июня, 11:51

Александр Березин

Американские ученые заявили о первом в истории создании GPS-помех из космоса — русскими спутниками

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

Оружие и техника

# GPS

# космонавтика

# космос

# спутники

27 мая, 17:06

Александр Березин

Илон Маск обвинил военных США в использования Starlink на дронах-камикадзе

Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.

Космонавтика

# SpaceX

# Starlink

# космос

# США

31 мая, 11:48

Игорь Байдов

Во всем мире любить стали меньше

Исследователи опросили более 60 тысяч испытуемых из разных стран и выяснили: чем больше человек зациклен на себе, тем холоднее он к своему партнеру. Правда, снижение накала страстей не всегда плохо, у этого есть и положительные стороны.

Психология

# индивидуализм

# любовь

# мировоззрение

# общество

# чувства

# эгоизм

[miniorange_social_login]

Да, тормозной путь автомобиля зависит от его массы, но зависимость эта не является прямой и однозначной. Тормозной путь определяется несколькими факторами: 1. **Кинетическая энергия**: Чем больше масса автомобиля, тем больше его кинетическая энергия при той же скорости. Это означает, что требуется больше энергии для остановки тяжелого автомобиля, что может увеличить тормозной путь. 2. **Сила трения**: Тормозной путь также зависит от силы трения между шинами и дорогой. Сила трения пропорциональна массе автомобиля (через нормальную силу). Однако, если мы увеличиваем массу автомобиля, сила трения тоже увеличивается, что частично компенсирует увеличение кинетической энергии. 3. **Эффективность тормозов**: Современные системы торможения спроектированы так, чтобы учитывать массу автомобиля, и часто в тяжелых автомобилях устанавливают более мощные тормозные системы. Таким образом, эффективность торможения может оставаться высокой, несмотря на увеличенную массу. В общем, при одинаковых условиях (типы шин, покрытие дороги, эффективность тормозной системы) увеличение массы автомобиля может незначительно увеличить тормозной путь, но этот эффект не является линейным из-за компенсирующего влияния силы трения.

Ответить

Максим Рындин

27.05.2024

Питон, вполне отлично справляется с этой задачей. Лучше большинства людей, которые не поймут в принципе условия задачи по вполне объективным причинам. Поспрашивайте людей на улице, вот там точно сказочников найдете.

Ответить

Питон Удав

27.05.2024

Ответить

—

Aleksei Savva

27.05.2024

Питон, вполне нормальный ответ получил. ChatGPT 3,5

Ответить

ещё комментарии

Aleksei Savva

27.05.2024

Ответить

Максим Рындин

27.05.2024

Ответить

Исследователи поймали ИИ на лжи. Он соврал намеренно и начал манипулировать

По теме

Ученые узнали, какие студенты более склонны прибегать к помощи ИИ

Ученые Сколтеха научились прогнозировать засухи на год вперед

Пентагон проверил способность ИИ предсказывать оперативную обстановку на дни вперед

Популярное

Комментарии

Последние новости:

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Врожденную любовь к луку связали с защитой от гипертонии и диабета

Летнее солнце помогло не всем при дефиците витамина D — вопреки тому, во что все верили

Западная поп-музыка стала более эгоцентричной за последние 50 лет

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Жанна д’Арк: как неграмотная девушка определила будущее мира

Они прилетели из чужих миров: как Оумуамуа, комета Борисова и 3I/ATLAS изменили астрономию

Татуированные кочевники: как в России спасают редких соколов-бало́банов

Последние комментарии

Самые обсуждаемые

Главная ошибка Вашингтона: почему США не смогли победить Иран?

В джунглях Борнео нашли нового сверхпаразита

SpaceX впервые в истории протестировала средство космической доставки грузов в нужную точку Земли

Астрономы нашли древнюю «фабрику» гигантских галактик