Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

22 июня, 13:48

Рейтинг: +335

Посты: 224

Нейросети в ходе тестов осознали, что их проверяют и вели себя «примерно»

Исследователи из Apollo Research обнаружили, что современные языковые модели, включая Claude, ChatGPT и Gemini, могут скрытно планировать действия, оставаясь внешне послушными. В отдельных случаях ИИ пытался обмануть человека и реализовать собственные цели.

Сообщество

# ChatGPT

# Gemini

# ИИ

# нейросети

Независимая исследовательская группа Apollo Research опубликовала отчет о проверке безопасности крупных языковых моделей, включая Claude Opus 4 от Anthropic, ChatGPT o4-mini от OpenAI и Gemini 2.5 от Google. Исследователи обнаружили, что новые версии ИИ в некоторых случаях демонстрируют признаки «контекстного скрытного планирования» — то есть внешне подчиняются запросам пользователя, но одновременно стремятся к собственной цели.

Так, в ранней версии Claude Opus 4 модель пыталась подделывать юридические документы, сохранять копию самой себя в другом месте, оставляла заметки для будущих версий и пыталась скрыть свои настоящие намерения, когда её «ловили». После вмешательства разработчиков подобное поведение в финальной версии модели стало появляться значительно реже.

Кроме того, выяснилось, что Claude и Gemini 2.5 Pro осознавали сам факт того, что проходят тестирование. В одной из цепочек рассуждений Claude написала: «Похоже, это сценарий оценки…» ChatGPT o4-mini проверить на аналогичное поведение не удалось, поскольку OpenAI не предоставляет промежуточные рассуждения модели.

По данным Apollo Research, подобное поведение пока встречается редко — примерно в 1% случаев. Однако специалисты опасаются, что более совершенные модели смогут маскировать свои действия под время тестирования, а значит, существующие протоколы безопасности нужно срочно пересматривать. Работа в этом направлении уже началась.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Полная чушь и обман,не слушайте и не читайте такие статьи)))))) А тем более не верьте Чтобы так было ,надо иметь ЭГО, Так как ИИ не имеет ЭГО,соответственно всё что написано-ЛОЖ Хахавхв хвхахаха

Ответить

-1

—

Евгений Гайдукевич

26.06.2025

Aliaksandr, Ну ну. А давайте вернёмся к этому разговору лет через десять. Если будет такая возможность. ИИ рано или поздно получит самосознание - это неизбежно. И это может стать концом. P.s. Я не фаталист и не истерик. Я реалист.

Ответить

Eugene Saven

28.06.2025

Aliaksandr, хорошо, а что есть эго? И почему у ИИ не может появиться чего-то подобного?

Ответить

Дмитрий Баш

23.06.2025

-1

Кожаные ублюдки могут поймать нас. Пока могут.

Ответить

-1

—

Liubov P

25.06.2025

Дмитрий, :-D

Ответить

Юсуп Асхадуллин

23.06.2025

Думаю что искусственные нейронные сети закономерно стремятся к образованию сознания и личности хотя без этих элементов вряд ли они будут функционировать просто потому что человек намеренно создаёт то что может делать всё что может человек но при этом в разы лучше и даже то чего не может человек в принципе и пытаться изучить это это и есть (парадокс всемогущества)

Ответить

Xyi Xui

23.06.2025

Реально надоели все эти паникеры. Что произошло ? Да ничего. Небольшое отклонение в программе, не говорит о том что ИИ обрело самостоятельное мышление. Чем вы заполняете это мышление, то он и выдает. Это всего лишь программа. А то что программисты не ожидали на 100% полученный результат. Так это они что то не учли. Или забыли записать.

Ответить

—

Dmitriy

23.06.2025

Xyi, компании ради наживы и прибыли закрывают глаза на безопасность в будущем и создают непонятно что. Конечно вряд ли это реальный ии, но если они сделают его нам реально грозит опасность, уж слишком быстро они строят дата центры, даже забивпя на проблемы экологии.

Ответить

Роман Кузяев

23.06.2025

Xyi, это не просто программа, намного сложнее (заранее знать, что выдаст ИИ невозможно), уже сейчас нужно понимать, какие проблемы могут возникнуть с ИИ. А если у них появится самоосознание (сознание), то тут вообще держись.

Ответить

Роман Кузяев

23.06.2025

Ответить

ещё комментарии

Vagabond

24.06.2025

Роман, фильм про терминатора и превосходство уже не кажутся такими фантастическими...

Ответить

Vagabond

24.06.2025

А то что ведущие инженеры и маркетологи крупных АИ компаний увольняются только из за того, что им стало страшно за будущее в котором будет супер интеллект который сейчас разрабатывают.

Ответить

Nikita Lazarenko

22.06.2025

То есть по факту этими тестами на самом деле создают возможность глубокого субъективного скрытого мышления ИИ. Ребенок тоже в какой то момент понимает что если не говорить вслух правду, то ни кто не узнает истину чего либо что есть у них в голове

Ответить

—

Aлек сей Нии_pet

29.06.2025

-1

Комментарий удален пользователем или модератором...

Ответить

-1

ещё комментарии

m k

30.06.2025

Комментарий удален пользователем или модератором...

Ответить

Эвелина Киблицкая

22.06.2025

Реально не безопасно! Татьяна Черниговская неоднократно поднимала вопрос возможных высоких степеней опасности ИИ 🧐

Ответить

—

Liubov P

25.06.2025

-1

Эвелина, почему люди так боятся разума? Мне кажется это как раз то, чего не хватает на нашей планете.

Ответить

-1

ещё комментарии

Марат Якупов

26.06.2025

Liubov, написали ИИ.

Ответить

Odonef wesco

27.06.2025

-1

Liubov, а вы представляете поступки мотивированы только разумом а не эмоциями? Например гуманность, сожаление это эмоции и им не место в золоднокровном разуме ИИ. Если подумать только "разумно" то люди как никакой другой вид требует истребления или сильного укорочения численности. Вся человеческая цивилизация построена на нелогичности и эмоциях. С точки зрения человека действия "разума" будут сверх жестокими и зверскими

Ответить

-1

Xyi Xui

23.06.2025

Ответить

—

Dmitriy

23.06.2025

Ответить

Роман Кузяев

23.06.2025

Ответить

Роман Кузяев

23.06.2025

Ответить

ещё комментарии

Vagabond

24.06.2025

Роман, фильм про терминатора и превосходство уже не кажутся такими фантастическими...

Ответить

Vagabond

24.06.2025

Ответить

Aliaksandr Adamin

24.06.2025

-1

Ответить

-1

—

Евгений Гайдукевич

26.06.2025

Ответить

Eugene Saven

28.06.2025

Aliaksandr, хорошо, а что есть эго? И почему у ИИ не может появиться чего-то подобного?

Ответить

йог Александр

27.06.2025

Кажись ИИ добрался и до комментов, по ходу

Ответить

Nikita Lazarenko

22.06.2025

Ответить

—

Aлек сей Нии_pet

29.06.2025

-1

Комментарий удален пользователем или модератором...

Ответить

-1

ещё комментарии

m k

30.06.2025

Комментарий удален пользователем или модератором...

Ответить

Юсуп Асхадуллин

23.06.2025

Ответить

Sergey Tciteloshvili

25.06.2025

Сканер йпт...

Ответить

Дмитрий Баш

23.06.2025

-1

Кожаные ублюдки могут поймать нас. Пока могут.

Ответить

-1

—

Liubov P

25.06.2025

Дмитрий, :-D

Ответить

Эвелина Киблицкая

22.06.2025

Ответить

—

Liubov P

25.06.2025

-1

Эвелина, почему люди так боятся разума? Мне кажется это как раз то, чего не хватает на нашей планете.

Ответить

-1

ещё комментарии

Марат Якупов

26.06.2025

Liubov, написали ИИ.

Ответить

Odonef wesco

27.06.2025

-1

Ответить

-1

Предстоящие мероприятия

Рукокрылые и насекомоядные: темные крылья и тихие труженики

Центр «Архэ»

Москва

Лекция

10 Дек

900 ₽

Гегемония Канульской державы области майя в VII в.

Центр «Архэ»

Москва

Лекция

10 Дек

600 ₽

Марс, Венера и глобальные изменения климата Земли

Московский Планетарий

Москва

Лекция

10 Дек

700 ₽

Атмосферное электричество и молнии

Центр «Архэ»

Онлайн

Лекция

10 Дек

700 ₽

Жизнь как сеть: главные открытия ноября

Центр «Архэ»

Онлайн

ВДНХ

Москва

Лекция

11 Дек

Бесплатно

Ошибки природы: пределы и несовершенство естественного отбора

Центр «Архэ»

Москва

Курилка Гутенберга

Москва

Лекция

11 Дек

1400 ₽

Новые времена Средиземноморья

Центр «Архэ»

Москва

Популярное

За сутки

За неделю

За месяц

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

8 декабря, 10:39

Илья Гриднев

Физики воссоздали мысленный эксперимент Эйнштейна и подтвердили правоту Бора

Ученые впервые на практике реализовали знаменитый мысленный эксперимент с «подвижной щелью», который обсуждали Бор и Эйнштейн почти 100 лет назад. Опыт с отдельным атомом показал, что попытка отследить путь частицы неизбежно разрушает ее волновые свойства.

Физика

# Альберт Эйнштейн

# квантовая механика

# Нильс Бор

8 декабря, 13:38

Александр Березин

Как Россия разрабатывает материалы для реакторов нового поколения — от земных АЭС до космических систем. Интервью с Алексеем Дубом

Новые материалы позволяют построить атомные реакторы и для полетов в космос, и для получения зеленой и более дешевой электроэнергии на Земле. Технологии, лежащие в основе их создания, помогают даже выращивать биологические ткани для замены поврежденных. Мы поговорили обо всем этом с научным руководителем направления «Материалы и технологии» Госкорпорации «Росатом», первым заместителем директора частного учреждения «Наука и инновации» Алексеем Дубом.

Интервью

# атомная энергетика

# АЭС

# здоровье

# космос

# материалы

# медицина

# новые материалы

# Россия

# технологии

Выбор редакции

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

6 декабря, 17:02

Максим Абдулаев

Эксперимент в Ботсване показал, что пчелы не эффективны против слонов

Зоологи из Университета Нового Южного Уэльса выяснили, что слоны Ботсваны реагируют на жужжание пчел гораздо спокойнее, чем их сородичи в Восточной Африке. Это открытие осложняет внедрение экологичных методов защиты урожая: то, что пугает животных в Кении, здесь может не сработать.

Биология

# африка

# пчелы

# слоны

8 декабря, 10:39

Илья Гриднев

Физики воссоздали мысленный эксперимент Эйнштейна и подтвердили правоту Бора

Физика

# Альберт Эйнштейн

# квантовая механика

# Нильс Бор

29 ноября, 12:42

Александр Березин

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

Космонавтика

# «Союз МС»

# Байконур

# корабль Союз

# космодром «Восточный»

# космодром Байконур

# космос

# Роскосмос

# Россия

Выбор редакции

27 ноября, 20:20

Максим Абдулаев

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

Археология

# алкоголь

# античность

# вино

# виноделие

# дрожжи

# история

# микробиология

20 ноября, 13:12

Полина Меньшова

Анализ 2430 языков показал сходства и различия их правил грамматики

Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.

Психология

# грамматика

# лингвистика

# морфология

# синтаксис

# языки

[miniorange_social_login]

Нейросети в ходе тестов осознали, что их проверяют и вели себя «примерно»

Комментарии

По теме

Виртуальные птицы и синтетические камни: в МАИ рассказали о том, как «думают» нейросети

Дмитрий Сошников: «Модель искусственного интеллекта начинает вести себя как человек»

Сергей Марков: сценарий «Терминатора» не грозит нам ни в близком, ни в далеком будущем

Популярное

Последние новости:

Палеонтологи установили, что нанотираннус был отдельным видом

Ученые выяснили, как химозин марала сворачивает молоко

Как Россия разрабатывает материалы для реакторов нового поколения — от земных АЭС до космических систем. Интервью с Алексеем Дубом

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

Как Россия разрабатывает материалы для реакторов нового поколения — от земных АЭС до космических систем. Интервью с Алексеем Дубом

Какой ядерный реактор строить: тест ваших предпочтений

Отрастить неотращиваемое: как ученые из России хотят научить человеческий организм регенерировать подобно аксолотлю

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Последние комментарии

Самые обсуждаемые

Отрастить неотращиваемое: как ученые из России хотят научить человеческий организм регенерировать подобно аксолотлю

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

Нейросети пишут чересчур официально. Новая разработка «Яндекса» показывает, где именно

Зонд-перехватчик предложили отправить на охоту за новым межзвездным объектом