Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

22 июня, 13:48

Рейтинг: +335

Посты: 224

Нейросети в ходе тестов осознали, что их проверяют и вели себя «примерно»

Исследователи из Apollo Research обнаружили, что современные языковые модели, включая Claude, ChatGPT и Gemini, могут скрытно планировать действия, оставаясь внешне послушными. В отдельных случаях ИИ пытался обмануть человека и реализовать собственные цели.

Сообщество

# ChatGPT

# Gemini

# ИИ

# нейросети

Независимая исследовательская группа Apollo Research опубликовала отчет о проверке безопасности крупных языковых моделей, включая Claude Opus 4 от Anthropic, ChatGPT o4-mini от OpenAI и Gemini 2.5 от Google. Исследователи обнаружили, что новые версии ИИ в некоторых случаях демонстрируют признаки «контекстного скрытного планирования» — то есть внешне подчиняются запросам пользователя, но одновременно стремятся к собственной цели.

Так, в ранней версии Claude Opus 4 модель пыталась подделывать юридические документы, сохранять копию самой себя в другом месте, оставляла заметки для будущих версий и пыталась скрыть свои настоящие намерения, когда её «ловили». После вмешательства разработчиков подобное поведение в финальной версии модели стало появляться значительно реже.

Кроме того, выяснилось, что Claude и Gemini 2.5 Pro осознавали сам факт того, что проходят тестирование. В одной из цепочек рассуждений Claude написала: «Похоже, это сценарий оценки…» ChatGPT o4-mini проверить на аналогичное поведение не удалось, поскольку OpenAI не предоставляет промежуточные рассуждения модели.

По данным Apollo Research, подобное поведение пока встречается редко — примерно в 1% случаев. Однако специалисты опасаются, что более совершенные модели смогут маскировать свои действия под время тестирования, а значит, существующие протоколы безопасности нужно срочно пересматривать. Работа в этом направлении уже началась.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Полная чушь и обман,не слушайте и не читайте такие статьи)))))) А тем более не верьте Чтобы так было ,надо иметь ЭГО, Так как ИИ не имеет ЭГО,соответственно всё что написано-ЛОЖ Хахавхв хвхахаха

Ответить

-1

—

Евгений Гайдукевич

26.06.2025

Aliaksandr, Ну ну. А давайте вернёмся к этому разговору лет через десять. Если будет такая возможность. ИИ рано или поздно получит самосознание - это неизбежно. И это может стать концом. P.s. Я не фаталист и не истерик. Я реалист.

Ответить

Eugene Saven

28.06.2025

Aliaksandr, хорошо, а что есть эго? И почему у ИИ не может появиться чего-то подобного?

Ответить

Дмитрий Баш

23.06.2025

-1

Кожаные ублюдки могут поймать нас. Пока могут.

Ответить

-1

—

Liubov P

25.06.2025

Дмитрий, :-D

Ответить

Юсуп Асхадуллин

23.06.2025

Думаю что искусственные нейронные сети закономерно стремятся к образованию сознания и личности хотя без этих элементов вряд ли они будут функционировать просто потому что человек намеренно создаёт то что может делать всё что может человек но при этом в разы лучше и даже то чего не может человек в принципе и пытаться изучить это это и есть (парадокс всемогущества)

Ответить

Xyi Xui

23.06.2025

Реально надоели все эти паникеры. Что произошло ? Да ничего. Небольшое отклонение в программе, не говорит о том что ИИ обрело самостоятельное мышление. Чем вы заполняете это мышление, то он и выдает. Это всего лишь программа. А то что программисты не ожидали на 100% полученный результат. Так это они что то не учли. Или забыли записать.

Ответить

—

Dmitriy

23.06.2025

Xyi, компании ради наживы и прибыли закрывают глаза на безопасность в будущем и создают непонятно что. Конечно вряд ли это реальный ии, но если они сделают его нам реально грозит опасность, уж слишком быстро они строят дата центры, даже забивпя на проблемы экологии.

Ответить

Роман Кузяев

23.06.2025

Xyi, это не просто программа, намного сложнее (заранее знать, что выдаст ИИ невозможно), уже сейчас нужно понимать, какие проблемы могут возникнуть с ИИ. А если у них появится самоосознание (сознание), то тут вообще держись.

Ответить

Роман Кузяев

23.06.2025

Ответить

ещё комментарии

Vagabond

24.06.2025

Роман, фильм про терминатора и превосходство уже не кажутся такими фантастическими...

Ответить

Vagabond

24.06.2025

А то что ведущие инженеры и маркетологи крупных АИ компаний увольняются только из за того, что им стало страшно за будущее в котором будет супер интеллект который сейчас разрабатывают.

Ответить

Nikita Lazarenko

22.06.2025

То есть по факту этими тестами на самом деле создают возможность глубокого субъективного скрытого мышления ИИ. Ребенок тоже в какой то момент понимает что если не говорить вслух правду, то ни кто не узнает истину чего либо что есть у них в голове

Ответить

—

Aлек сей Нии_pet

29.06.2025

-1

Комментарий удален пользователем или модератором...

Ответить

-1

ещё комментарии

m k

30.06.2025

Комментарий удален пользователем или модератором...

Ответить

Эвелина Киблицкая

22.06.2025

Реально не безопасно! Татьяна Черниговская неоднократно поднимала вопрос возможных высоких степеней опасности ИИ 🧐

Ответить

—

Liubov P

25.06.2025

-1

Эвелина, почему люди так боятся разума? Мне кажется это как раз то, чего не хватает на нашей планете.

Ответить

-1

ещё комментарии

Марат Якупов

26.06.2025

Liubov, написали ИИ.

Ответить

Odonef wesco

27.06.2025

-1

Liubov, а вы представляете поступки мотивированы только разумом а не эмоциями? Например гуманность, сожаление это эмоции и им не место в золоднокровном разуме ИИ. Если подумать только "разумно" то люди как никакой другой вид требует истребления или сильного укорочения численности. Вся человеческая цивилизация построена на нелогичности и эмоциях. С точки зрения человека действия "разума" будут сверх жестокими и зверскими

Ответить

-1

Xyi Xui

23.06.2025

Ответить

—

Dmitriy

23.06.2025

Ответить

Роман Кузяев

23.06.2025

Ответить

Роман Кузяев

23.06.2025

Ответить

ещё комментарии

Vagabond

24.06.2025

Роман, фильм про терминатора и превосходство уже не кажутся такими фантастическими...

Ответить

Vagabond

24.06.2025

Ответить

Aliaksandr Adamin

24.06.2025

-1

Ответить

-1

—

Евгений Гайдукевич

26.06.2025

Ответить

Eugene Saven

28.06.2025

Aliaksandr, хорошо, а что есть эго? И почему у ИИ не может появиться чего-то подобного?

Ответить

йог Александр

27.06.2025

Кажись ИИ добрался и до комментов, по ходу

Ответить

Nikita Lazarenko

22.06.2025

Ответить

—

Aлек сей Нии_pet

29.06.2025

-1

Комментарий удален пользователем или модератором...

Ответить

-1

ещё комментарии

m k

30.06.2025

Комментарий удален пользователем или модератором...

Ответить

Юсуп Асхадуллин

23.06.2025

Ответить

Sergey Tciteloshvili

25.06.2025

Сканер йпт...

Ответить

Дмитрий Баш

23.06.2025

-1

Кожаные ублюдки могут поймать нас. Пока могут.

Ответить

-1

—

Liubov P

25.06.2025

Дмитрий, :-D

Ответить

Эвелина Киблицкая

22.06.2025

Ответить

—

Liubov P

25.06.2025

-1

Эвелина, почему люди так боятся разума? Мне кажется это как раз то, чего не хватает на нашей планете.

Ответить

-1

ещё комментарии

Марат Якупов

26.06.2025

Liubov, написали ИИ.

Ответить

Odonef wesco

27.06.2025

-1

Ответить

-1

Предстоящие мероприятия

Здравствуй, …., Новый год!

Гиперион

Москва

Космонавтика и авиация

Москва

Космонавтика и авиация

Москва

Экскурсия

09 Янв

1300 ₽

Когда Луна с Солнцем встречаются

Пулковская обсерватория

Санкт-Петербург

Лекция

13 Янв

1000 ₽

Эволюционная биология: итоги 2025 года

Центр «Архэ»

Онлайн

Лекция

14 Янв

500 ₽

Столкновения в Солнечной системе

Московский Планетарий

Москва

Лекция

14 Янв

1200 ₽

Медицинские итоги 2025 года

Центр «Архэ»

Москва

Лекция

14 Янв

900 ₽

Кризис классических царств майя и возвышение Чичен-Ицы

Центр «Архэ»

Москва

Лекция

15 Янв

1200 ₽

Астрофизические итоги 2025 года

Центр «Архэ»

Москва

Популярное

За сутки

За неделю

За месяц

27 декабря, 17:46

Адель Романова

3I/ATLAS оказалась намного меньше по размерам, чем ожидали ученые

После открытия объекта 3I/ATLAS предполагалось, что ядро межзвездной кометы могло иметь гигантские размеры. Но в процессе дальнейших наблюдений выяснилось, что эти оценки были явно завышены. Недавние расчеты показали, что на самом деле 3I/ATLAS по размерам соответствует среднестатистическим или даже самым компактным кометам Солнечной системы.

Астрономия

# кометы

# космос

# межзвездная комета

28 декабря, 16:21

Александр Березин

С космодрома Восточный стартовала ракета с 52 спутниками

В 16.18 по московскому времени 28 декабря 2025 года с единственного гражданского космодрома на территории России произошел 17-й по счету космический запуск этого года. Перед ним на космодроме побывал корреспондент нашего издания, и вскоре мы выпустим репортаж о том, чем живет самый холодный космодром в мире.

Космонавтика

# «Восточный»

# космос

# Роскосмос

# Россия

27 декабря, 10:10

Любовь С.

В другой планетной системе впервые зафиксировали следы разрушения комет

Вокруг звезды HD 131488, расположенной в созвездии Центавра (Centaurus) на расстоянии около 152 световых лет от Земли, впервые зафиксировали следы монооксида углерода (CO), который образуется при столкновениях и испарении комет. Находка открывает новую страницу в изучении формирования планетных систем.

Астрономия

# Джеймс Уэбб

# кометы

# околозвездный диск

# планеты

# спектральный анализ

# спектрограф

26 декабря, 15:47

Максим Абдулаев

Генетический анализ показал, что миксины обладают неожиданно сложной системой обоняния, возникшей на заре эволюции позвоночных

Биологи опровергли представление о примитивности органов чувств у древнейших бесчелюстных, обнаружив у миксин огромный арсенал рецепторов для поиска добычи. Исследователи доказали, что способность различать сложные запахи и аминокислоты появилась у общего предка позвоночных задолго до возникновения челюстей.

Биология

# миксины

# обоняние

# эволюция

27 декабря, 17:46

Адель Романова

3I/ATLAS оказалась намного меньше по размерам, чем ожидали ученые

Астрономия

# кометы

# космос

# межзвездная комета

28 декабря, 16:21

Александр Березин

С космодрома Восточный стартовала ракета с 52 спутниками

Космонавтика

# «Восточный»

# космос

# Роскосмос

# Россия

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

17 декабря, 14:19

Игорь Байдов

Пингвины Аргентины столкнулись с новым сухопутным врагом

На скалистых берегах аргентинской Патагонии разворачивается настоящая драма. Магеллановы пингвины, долгое время чувствовавшие себя в безопасности на суше в своих многотысячных колониях, столкнулись с новым и беспощадным врагом. Их извечные морские страхи — касатки и морские леопарды — теперь блекнут перед угрозой, пришедшей из глубины материка. Виновник переполоха — грациозный и мощный хищник, недавно вернувшийся на эти земли после долгого изгнания.

Биология

# животные

# охота

# Пингвины

# птицы

# пума

23 декабря, 10:51

Игорь Байдов

Астрономы приблизились к доказательству существования квазизвезд

Среди самых интригующих открытий космического телескопа «‎Джеймс Уэбб» — компактные объекты, получившие название «маленькие красные точки». Их видели только в самых дальних уголках Вселенной. Большинство возникло в первый миллиард лет после Большого взрыва, и ученые предполагали, что такие источники представляют собой небольшие компактные галактики. Однако международная команда астрономов пришла к иному выводу. Они предположили, что на самом деле «маленькие красные точки» — черные дыры, окруженные массивной газовой оболочкой.

Астрономия

# вселенная

# гравитационное линзирование

# Джеймс Уэбб

# звезды

# ранняя вселенная

# телескоп Джеймса Уэбба

# Черные дыры

[miniorange_social_login]