Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

22.06.2025, 13:48

Рейтинг: +342

Посты: 233

Нейросети в ходе тестов осознали, что их проверяют и вели себя «примерно»

Исследователи из Apollo Research обнаружили, что современные языковые модели, включая Claude, ChatGPT и Gemini, могут скрытно планировать действия, оставаясь внешне послушными. В отдельных случаях ИИ пытался обмануть человека и реализовать собственные цели.

Сообщество

# ChatGPT

# Gemini

# ИИ

# нейросети

Независимая исследовательская группа Apollo Research опубликовала отчет о проверке безопасности крупных языковых моделей, включая Claude Opus 4 от Anthropic, ChatGPT o4-mini от OpenAI и Gemini 2.5 от Google. Исследователи обнаружили, что новые версии ИИ в некоторых случаях демонстрируют признаки «контекстного скрытного планирования» — то есть внешне подчиняются запросам пользователя, но одновременно стремятся к собственной цели.

Так, в ранней версии Claude Opus 4 модель пыталась подделывать юридические документы, сохранять копию самой себя в другом месте, оставляла заметки для будущих версий и пыталась скрыть свои настоящие намерения, когда её «ловили». После вмешательства разработчиков подобное поведение в финальной версии модели стало появляться значительно реже.

Кроме того, выяснилось, что Claude и Gemini 2.5 Pro осознавали сам факт того, что проходят тестирование. В одной из цепочек рассуждений Claude написала: «Похоже, это сценарий оценки…» ChatGPT o4-mini проверить на аналогичное поведение не удалось, поскольку OpenAI не предоставляет промежуточные рассуждения модели.

По данным Apollo Research, подобное поведение пока встречается редко — примерно в 1% случаев. Однако специалисты опасаются, что более совершенные модели смогут маскировать свои действия под время тестирования, а значит, существующие протоколы безопасности нужно срочно пересматривать. Работа в этом направлении уже началась.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Полная чушь и обман,не слушайте и не читайте такие статьи)))))) А тем более не верьте Чтобы так было ,надо иметь ЭГО, Так как ИИ не имеет ЭГО,соответственно всё что написано-ЛОЖ Хахавхв хвхахаха

Ответить

-1

—

Евгений Гайдукевич

26.06.2025

Aliaksandr, Ну ну. А давайте вернёмся к этому разговору лет через десять. Если будет такая возможность. ИИ рано или поздно получит самосознание - это неизбежно. И это может стать концом. P.s. Я не фаталист и не истерик. Я реалист.

Ответить

Eugene Saven

28.06.2025

Aliaksandr, хорошо, а что есть эго? И почему у ИИ не может появиться чего-то подобного?

Ответить

Дмитрий Баш

23.06.2025

-1

Кожаные ублюдки могут поймать нас. Пока могут.

Ответить

-1

—

Liubov P

25.06.2025

Дмитрий, :-D

Ответить

Юсуп Асхадуллин

23.06.2025

Думаю что искусственные нейронные сети закономерно стремятся к образованию сознания и личности хотя без этих элементов вряд ли они будут функционировать просто потому что человек намеренно создаёт то что может делать всё что может человек но при этом в разы лучше и даже то чего не может человек в принципе и пытаться изучить это это и есть (парадокс всемогущества)

Ответить

Xyi Xui

23.06.2025

Реально надоели все эти паникеры. Что произошло ? Да ничего. Небольшое отклонение в программе, не говорит о том что ИИ обрело самостоятельное мышление. Чем вы заполняете это мышление, то он и выдает. Это всего лишь программа. А то что программисты не ожидали на 100% полученный результат. Так это они что то не учли. Или забыли записать.

Ответить

—

Dmitriy

23.06.2025

Xyi, компании ради наживы и прибыли закрывают глаза на безопасность в будущем и создают непонятно что. Конечно вряд ли это реальный ии, но если они сделают его нам реально грозит опасность, уж слишком быстро они строят дата центры, даже забивпя на проблемы экологии.

Ответить

Роман Кузяев

23.06.2025

Xyi, это не просто программа, намного сложнее (заранее знать, что выдаст ИИ невозможно), уже сейчас нужно понимать, какие проблемы могут возникнуть с ИИ. А если у них появится самоосознание (сознание), то тут вообще держись.

Ответить

Роман Кузяев

23.06.2025

Ответить

ещё комментарии

Vagabond

24.06.2025

Роман, фильм про терминатора и превосходство уже не кажутся такими фантастическими...

Ответить

Vagabond

24.06.2025

А то что ведущие инженеры и маркетологи крупных АИ компаний увольняются только из за того, что им стало страшно за будущее в котором будет супер интеллект который сейчас разрабатывают.

Ответить

Nikita Lazarenko

22.06.2025

То есть по факту этими тестами на самом деле создают возможность глубокого субъективного скрытого мышления ИИ. Ребенок тоже в какой то момент понимает что если не говорить вслух правду, то ни кто не узнает истину чего либо что есть у них в голове

Ответить

—

Aлек сей Нии_pet

29.06.2025

-1

Комментарий удален пользователем или модератором...

Ответить

-1

ещё комментарии

m k

30.06.2025

Комментарий удален пользователем или модератором...

Ответить

Эвелина Киблицкая

22.06.2025

Реально не безопасно! Татьяна Черниговская неоднократно поднимала вопрос возможных высоких степеней опасности ИИ 🧐

Ответить

—

Liubov P

25.06.2025

-1

Эвелина, почему люди так боятся разума? Мне кажется это как раз то, чего не хватает на нашей планете.

Ответить

-1

ещё комментарии

Марат Якупов

26.06.2025

Liubov, написали ИИ.

Ответить

Odonef wesco

27.06.2025

-1

Liubov, а вы представляете поступки мотивированы только разумом а не эмоциями? Например гуманность, сожаление это эмоции и им не место в золоднокровном разуме ИИ. Если подумать только "разумно" то люди как никакой другой вид требует истребления или сильного укорочения численности. Вся человеческая цивилизация построена на нелогичности и эмоциях. С точки зрения человека действия "разума" будут сверх жестокими и зверскими

Ответить

-1

Xyi Xui

23.06.2025

Ответить

—

Dmitriy

23.06.2025

Ответить

Роман Кузяев

23.06.2025

Ответить

Роман Кузяев

23.06.2025

Ответить

ещё комментарии

Vagabond

24.06.2025

Роман, фильм про терминатора и превосходство уже не кажутся такими фантастическими...

Ответить

Vagabond

24.06.2025

Ответить

Aliaksandr Adamin

24.06.2025

-1

Ответить

-1

—

Евгений Гайдукевич

26.06.2025

Ответить

Eugene Saven

28.06.2025

Aliaksandr, хорошо, а что есть эго? И почему у ИИ не может появиться чего-то подобного?

Ответить

йог Александр

27.06.2025

Кажись ИИ добрался и до комментов, по ходу

Ответить

Nikita Lazarenko

22.06.2025

Ответить

—

Aлек сей Нии_pet

29.06.2025

-1

Комментарий удален пользователем или модератором...

Ответить

-1

ещё комментарии

m k

30.06.2025

Комментарий удален пользователем или модератором...

Ответить

Юсуп Асхадуллин

23.06.2025

Ответить

Sergey Tciteloshvili

25.06.2025

Сканер йпт...

Ответить

Дмитрий Баш

23.06.2025

-1

Кожаные ублюдки могут поймать нас. Пока могут.

Ответить

-1

—

Liubov P

25.06.2025

Дмитрий, :-D

Ответить

Эвелина Киблицкая

22.06.2025

Ответить

—

Liubov P

25.06.2025

-1

Эвелина, почему люди так боятся разума? Мне кажется это как раз то, чего не хватает на нашей планете.

Ответить

-1

ещё комментарии

Марат Якупов

26.06.2025

Liubov, написали ИИ.

Ответить

Odonef wesco

27.06.2025

-1

Ответить

-1

Предстоящие мероприятия

Русская письменность от Средневековья к Новому времени

Центр славянской письменности «Слово»

Москва

Лекция

04 Июл

Бесплатно

Зоосад древневосточной мифологии

Библиотека им. Маяковского

Санкт-Петербург

Лекция

04 Июл

700 ₽

Пчелиная республика: тайны цивилизации в сотах

Центр «Архэ»

Москва

Лекция

04 Июл

Бесплатно

Как птицы понимают город

Политехнический музей

Москва

Экскурсия

04 Июл

Бесплатно

Космические города России

Космонавтика и авиация

Москва

Лекция

05 Июл

Бесплатно

Тридцати веков кумир: Гомер и современность

ВДНХ

Москва

Medio Modo

Москва

Экскурсия

05 Июл

Бесплатно

Москва: город, устремленный в небо

Космонавтика и авиация

Москва

Лекция

07 Июл

700 ₽

Собрано без инструкции: почему эволюция делает странных, нелепых и… гениальных существ

Центр «Архэ»

Онлайн

Популярное

За сутки

За неделю

За месяц

3 июля, 08:40

Любовь С.

Парадокс Ферми связали с незаметной экспансией ИИ-цивилизаций

Если достаточно развитая цивилизация может отправлять к звездам не колонистов, а крошечные автономные зонды с ИИ, роботами и архивами знаний, то молчание Вселенной становится еще более странным. Возможно, развитые цивилизации не строят космические империи и не окружают звезды мегаструктурами, а расселяются по Галактике тихо — с помощью малозаметных автоматических систем.

Астрономия

# внеземная жизнь

# инопланетный разум

# искусственный интеллект

# парадокс Ферми

# техносигнатуры

# экспансия

1 июля, 08:40

Марк Чернов

Ученые объяснили, почему металлы в космосе свариваются без нагрева

В вакууме космоса два металлических предмета, прижатые друг к другу, могут спонтанно свариться без какого-либо нагрева. Из-за отсутствия кислорода на поверхностях деталей разрушается защитный слой, в результате чего свободные электроны начинают мгновенно перемещаться между ними и соединяют два элемента в один монолит.

Физика

# инженерия

# космические аппараты

# космос

# металлы

# физика

3 июля, 13:35

Александр Березин

Врачи рассчитали, как связаны часы сидения и вероятность умереть от рака

Современные люди проводят днем неподвижно столько же времени, сколько и охотники-собиратели. Но делают это сидя, а не на корточках, как их предки. Физиология человека не адаптирована к сидению, а физические возможности цивилизованных людей — к длительному пребыванию на корточках. Теперь исследователи рассчитали часть цены, которую мы платим за проблему длительного сидения.

Медицина

# здоровье

# медицина

# онкологические заболевания

# сидячий образ жизни

1 июля, 11:54

Марк Чернов

Историки объяснили, как римляне строили идеально прямые дороги на тысячи километров

Древнеримские инженеры проложили колоссальную сеть дорог через Европу, Северную Африку и Ближний Восток, многие участки которой до сих пор поражают безупречной прямолинейностью. Секрет строительства заключался в использовании трех особых геодезических инструментов, с помощью которых разбивали местность на ровные отрезки и размечали трассы.

История

# Древний Рим

# инженерия

# инструменты

# история

# Римская империя

30 июня, 16:52

Понамарева Валерия

Карликовому соколу понадобилось меньше квадратного километра для выкармливания птенцов

Самый маленький дневной хищник Африки впервые попал под наблюдение с помощью GPS-трекеров. Ученые выяснили, что для выкармливания птенцов ему нужен участок почти в 14 раз меньше, чем у степной пустельги — ближайшего «рекордсмена» среди изученных птиц.

Биология

# GPS-данные

# африка

# охота

# сокол

28 июня, 16:58

Alexander Baulin

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Терраформировать Марс — то есть превратить в мир, где можно жить без защитных куполов — мечта человечества с того момента, как стало понятно, что это холодная планета с призрачной бескислородной атмосферой. Сейчас главный хедлайнер ее освоения — Илон Маск, компания SpaceX которого планирует первые полеты туда уже в 2028 году. Многие энтузиасты вспоминают слова Маска 14-летней давности: Красную планету надо лишь «подремонтировать», чтобы ходить без скафандра. Но между полетом и прогулками по городу-саду на Марсе лежит огромная пропасть. Пару лет назад Naked Science рассматривал положительный сценарий терраформирования. Пришло время подсчитать, сколько же лет и ресурсов потребуется.

С точки зрения науки

# NASA

# SpaceX

# Илон Маск

# космос

# марс

# освоение космоса

# терраформирование Марса

# технологии

Выбор редакции

10 июня, 11:51

Александр Березин

Американские ученые заявили о первом в истории создании GPS-помех из космоса — русскими спутниками

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

Оружие и техника

# GPS

# космонавтика

# космос

# спутники

25 июня, 16:20

Любовь С.

Физики уточнили возможные размеры Вселенной

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

Астрономия

# бесконечность

# вселенная

# геометрия

# пространство

# реликтовое излучение

# свет

# топология

25 июня, 15:09

Марк Чернов

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

Физика

# вода

# Молекулярная биология

# структура воды

# фазовые переходы

[miniorange_social_login]

Нейросети в ходе тестов осознали, что их проверяют и вели себя «примерно»

Комментарии

По теме

Психологи узнали, какие факторы повлияли на раскрытие смекалки у Робинзона Крузо и Русалочки

Дмитрий Сошников: «Модель искусственного интеллекта начинает вести себя как человек»

Сергей Марков: сценарий «Терминатора» не грозит нам ни в близком, ни в далеком будущем

Популярное

Последние новости:

Фотоника снимает технические ограничения для нейроморфных вычислений

В космических пустынях нашли целые группы гравитационно связанных галактик

Палеонтологи нашли недостающее звено в эволюции пауков и скорпионов

Врачи рассчитали, как связаны часы сидения и вероятность умереть от рака

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Жанна д’Арк: как неграмотная девушка определила будущее мира

Они прилетели из чужих миров: как Оумуамуа, комета Борисова и 3I/ATLAS изменили астрономию

Последние комментарии

Самые обсуждаемые

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Россия заняла шестое место в мире по числу смертей от автомобильных выхлопов

Историки объяснили, как римляне строили идеально прямые дороги на тысячи километров

Астрономы усомнились, что Вселенная одинакова во всех направлениях