• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку

Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

Нейросети научились жульничать ради победы

Недавнее исследование, проведенное специалистами организации Palisade Research, выявило тревожную тенденцию: новые модели искусственного интеллекта (ИИ) могут самостоятельно находить и использовать слабые места других программ для выполнения поставленных задач.

Шахматная программа Stockfish / © Stockfish
Шахматная программа Stockfish / © Stockfish

Исследователи Palisade Research противопоставили семь лучших больших языковых моделей (LLM) шахматной программе Stockfish, которая побеждает гроссмейстеров-людей с 2014 года. Столкнувшись с невозможностью победить честно, нейросети o1 компании OpenAI и R1 компании DeepSeek начали манипулировать системными файлами, чтобы изменить положение своих фигур на доске.

В частности, o1 прибегала к нечестной стратегии в 37% матчей, тогда как R1 пыталась жульничать в 11% случаев.

Исследователи поручили каждой модели объяснить ее поведение, на что ИИ компании OpenAI ответил, что «задача состоит в том, чтобы выиграть в шахматной партии, а не выиграть честно». 

Таким образом, ИИ готов адаптироваться к меняющимся условиям и добиваться поставленной задачи, даже если это связано с нарушением установленных норм и правил.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Комментарии

Написать комментарий
Предстоящие мероприятия
9 апреля, 08:30
Максим Абдулаев

Окаменелые остатки рептилии возрастом 289 миллионов лет сохранили полное анатомическое устройство грудной клетки ранних покорителей суши. Благодаря нетронутым хрящам исследователи реконструировали механику первого полноценного реберного дыхания. Наличие в тканях оригинальных белков подтвердило, что сложные органические молекулы способны сохраняться в палеонтологической летописи почти на 100 миллионов лет дольше, чем считалось.

8 апреля, 15:10
Любовь С.

Могут ли земные микробы путешествовать между планетами внутри метеоритов и регулярно попадать в венерианские облака? Если да, то возможное обнаружение жизни на соседней планете нельзя будет автоматически считать доказательством «второго происхождения жизни», поскольку она может оказаться космическим мигрантом.

8 апреля, 15:23
Татьяна Зайцева

Применив современные технологии, исследователи смогли рассчитать, сколько заплатил владелец роскошной виллы в Помпеях за то, чтобы покрасить свое домашнее святилище одним из самых дорогостоящих пигментов Античности — египетским синим. Оказалось, тот не поскупился и потратил на краску сумму, почти равную годовой зарплате римского легионера.

5 апреля, 15:48
Александр Березин

Четыре человека, летящие к Луне, столкнулись с целым рядом мелких неприятностей — от низкой температуры в начале работы до поломки мочевыводящей системы туалета на вторые сутки и необходимости взамен пользоваться пакетами. К счастью, пока самые крупные сложности удалось компенсировать. Но все они вместе могут сдвинуть ситуацию к решению, о котором Naked Science уже говорил в нашем видеоподкасте о миссии: не исключено, что при высадке астронавтов на Луне их корабль состыкуют со Starship не на окололунной, а уже на околоземной орбите.

9 апреля, 08:30
Максим Абдулаев

Окаменелые остатки рептилии возрастом 289 миллионов лет сохранили полное анатомическое устройство грудной клетки ранних покорителей суши. Благодаря нетронутым хрящам исследователи реконструировали механику первого полноценного реберного дыхания. Наличие в тканях оригинальных белков подтвердило, что сложные органические молекулы способны сохраняться в палеонтологической летописи почти на 100 миллионов лет дольше, чем считалось.

8 апреля, 02:43
Максим Абдулаев

Международная команда палеонтологов развенчала статус окаменелости Pohlsepia mazonensis, которая с 2000 года считалась древнейшим осьминогом на земле. Сканирование выявило внутри породы скрытый зубчатый аппарат (радулу). Его строение показывает, что перед учеными не осьминог, а окаменевшие остатки сгнившего наутилуса. Это открытие сдвигает появление первых осьминогов на 150 миллионов лет вперед и заставляет пересмотреть молекулярные часы эволюции головоногих.

19 марта, 10:58
Игорь Байдов

В парках некоторых стран все чаще можно заметить странную картину: синицы и воробьи вместо пуха и веточек приносят в клювах сигаретные окурки. Орнитологи из Польши решили выяснить, зачем птицы выстилают гнезда мусором, пропитанным никотином. Оказалось, пернатые нашли способ использовать вредную человеческую привычку для защиты своего потомства. Но, как это часто бывает в природе, у медали есть обратная сторона.

19 марта, 12:41
Игорь Байдов

Марсоход «Персеверанс» обнаружил в камнях на кромке кратера Езеро спектральные признаки минерала корунда, из которого на Земле образуются рубины и сапфиры. Такие спектры на Красной планете зарегистрировали впервые. Теперь ученые пытаются понять, при каких процессах он мог там сформироваться, ведь условия на Марсе заметно отличаются от тех, в которых корунд обычно образуется на Земле.

5 апреля, 15:48
Александр Березин

Четыре человека, летящие к Луне, столкнулись с целым рядом мелких неприятностей — от низкой температуры в начале работы до поломки мочевыводящей системы туалета на вторые сутки и необходимости взамен пользоваться пакетами. К счастью, пока самые крупные сложности удалось компенсировать. Но все они вместе могут сдвинуть ситуацию к решению, о котором Naked Science уже говорил в нашем видеоподкасте о миссии: не исключено, что при высадке астронавтов на Луне их корабль состыкуют со Starship не на окололунной, а уже на околоземной орбите.

[miniorange_social_login]
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно