16 сентября, 11:56

Александр Березин

5,2 тыс

Исследователи из OpenAI показали неустранимость галлюцинаций нейросетей

❋ 4.9

Периодически нейросети в своих ответах галлюцинируют, предлагая пользующимися их услугами людям выпить яд под видом лекарства и так далее. Новая научная работа показала, что эта проблема связана с самой природой нейросети. Хотя ее вероятность можно понизить, устранить полностью невозможно.

Технологии

# OpenAI

# большие языковые модели

# нейросети

Руководство OpenAI делает ставку на массовое использование нейросетей для замены человеческого труда, в частности. в программировании. Работа исследователей из той же компании показывает, что у таких подходов есть очень существенные и неустранимые проблемы / © Open AI

От способности нейросетей работать надежно зависит не просто чат обычных пользователей с ними, но и выживание ряда людей. Кто-то погибает из-за некорректных советов больших языковых моделей типа ChatGPT, кто-то может умереть из-за галлюцинации нейросети, управляющей автопилотом — тот, например, может принять обочину за дорогу и в итоге увести машину прямо в дерево (речь идет о гипотетическом случае). Учитывая, что такой автопилот стоит как подержанное авто, ясно, что подобные записи существенно снижают привлекательность автопилота для разумных потребителей.

Авторы новой работы, которую они выложили на сервер препринтов Корнеллского университета, решили выяснить, возможно ли в принципе решить проблему подобных галлюцинаций и сколько это будет стоить. Оказалось, что причины возникновения галлюцинаций разнообразны и полное их подавление поэтому нереалистично.

Во-первых, ошибки неизбежно содержатся в обучающей выборке текстов (или, в случае нейросетей для вождения, видеозаписей того, как водят реальные люди). Выборка может быть свободной от ошибок, только если она очень мала, а на такой нельзя построить работоспособную нейросеть в принципе.

Во-вторых, даже существуй некая большая выборка с нулевым количеством ошибок, это не решило бы проблему. В случае языковых моделей сам метод генерации их выдачи провоцирует галлюцинации. Они «предсказывают» каждое следующее слово в предложении, основываясь на вероятностях. В предложениях много слов, а вероятность ошибок нарастает с каждым последующим.

Вдобавок добавление каждого слова дает определенные оттенки смысла, а с ними растет и вероятность ошибки. Если бы нейросети задавали вопросы, требуя лишь ответа «да»/»нет«, вероятность неверного ответа была, как показали исследователи, как минимум вдвое ниже. Именно бинарная классификация удается им лучше всего.

Только у одной нейросети среди пользователей уже почти каждый десятый землянин. Нет сомнений, что в конечном счете ими станет большинство. Это порождает серьезную угрозу использования галлюцинаторной информации больших языковых моделей миллионами людей / © Open AI

В-третьих, крайне трудно устранимым источником галлюцинаций оказались системы тестирования нейросетей. Любая из них может достигнуть нулевой частоты галлюцинаций, если ее жестко «наказывать» за неправильные ответы, снижая баллы. Чтобы повысить их, нейросеть быстро начнет писать «Я не знаю» в ответ на любой вопрос, который не содержался в ее обучающей выборке. Но в таком случае она будет отвечать «Я не знаю» в очень большом числе случаев (десятки процентов). С точки зрения стандартного потребителя переход от нейросети, уверенно рассуждающей на нужную ему тему, к той, что в каждом четвертом случае станет генерировать «Я не знаю», будет снижением качества продукта.

Естественно, создатели языковых моделей стараются избежать такого, и их системы оценки выдачи нейросети «штрафуют» ее низкими баллами за частые ответы «Я не знаю». Это и становится третьим источником галлюцинаций: нейросети выгоднее сказать что угодно, потому что она может или угадать случайно, или оценивающие ее люди либо программы не смогут понять ее ошибку. Такое поведение часто демонстрируют студенты, пытающиеся прорваться через экзамен по сложному предмету «на шару».

Исследователи предположили, что можно частично обойти эту проблему — скажем, побуждая языковую модель задавать уточняющие вопросы в тех случаях, когда она не уверена в ответе. Метод рабочий, но чрезвычайно быстро повышающий вычислительные усилия, нужные на один ответ. Такое может быть оправдано в сложных отраслях с высокой ценой ошибки, но в условно-бесплатном чат-боте окупить его будет непросто.

Все это означает, что на практике нейросети без галлюцинаций предельно маловероятны и в будущем. Соответственно, нужно строить их использование с учетом практической неустранимости галлюцинаций, не полагаться на их ответы в тех случаях, когда цена ошибки может быть слишком высока. Это ставит под вопрос эффективность нейросетей и в области автопилота. Но окончательно разрешить сомнения по этому поводу может только практика ближайших лет.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# OpenAI

# большие языковые модели

# нейросети

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Когда природа повторяет себя: удивительные двойники эволюции

Центр «Архэ»

Онлайн

Лекция

16 Дек

Бесплатно

Битва за Ржев и взятие Ржева

Российская государственная библиотека

Москва

Лекция

16 Дек

Бесплатно

Как сохранить и представить исторические источники?

Библиотека иностранной литературы

Москва

Центр «Архэ»

Москва

Лекция

16 Дек

750 ₽

Особенности русской средневековой культуры

Центр «Архэ»

Онлайн

Курилка Гутенберга

Москва

Лекция

18 Дек

Бесплатно

Медицинские нейротехнологии

Нейрокампус

Москва

Лекция

18 Дек

1200 ₽

В космос по цене авиабилета

Центр «Архэ»

Москва

Лекция

18 Дек

Бесплатно

Андрэ Дави — исследователь Нила

Библиотека иностранной литературы

Москва

Популярное

За сутки

За неделю

За месяц

15 декабря, 08:10

Любовь С.

Опубликована «дорожная карта» первой пилотируемой миссии на Марс

В конце 2025 года Национальные академии наук, инженерии и медицины США представили доклад, посвященный будущим пилотируемым миссиям к Марсу. В документе подробно описаны причины, по которым людям стоит отправиться на Красную планету, а также технологии, способные приблизить человечество к первой высадке.

Астрономия

# астронавты

# жизнь на Марсе

# колонизация Марса

# космические аппараты

# пилотируемый полет

# поверхность марса

13 декабря, 14:51

Игорь Байдов

В прошлом у Марса могла быть большая луна, которая управляла приливами

На Красной планете ученые нашли предполагаемую «каменную летопись» древних приливов. Эту запись могла оставить не существующая сегодня сила — гравитация луны, которая когда-то красовалась в марсианском небе и управляла «ритмом» морей.

Астрономия

# вода на марсе

# Деймос

# марс

# спутники Марса

# Фобос

15 декабря, 11:02

Игорь Байдов

Римские завоеватели подорвали здоровье британцев на несколько столетий

Акведуки, дороги, бани и города, которые римляне построили на оккупированных территориях, часто воспринимаются историками как символ прогресса. Но археологические раскопки, проведенные учеными из Великобритании, открыли обратную, мрачную сторону этого «развития». Оказалось, римское владычество на несколько поколений подорвало здоровье местного населения, особенно тех, кто жил в административных центрах. Исследователи увидели эту печальную картину в костях наиболее уязвимых групп населения — женщин и детей, которые первыми реагируют на ухудшение условий жизни.

Археология

# бритты

# кельты

# патологии

# Рим

# Римская Британия

15 декабря, 08:10

Любовь С.

Опубликована «дорожная карта» первой пилотируемой миссии на Марс

Астрономия

# астронавты

# жизнь на Марсе

# колонизация Марса

# космические аппараты

# пилотируемый полет

# поверхность марса

12 декабря, 13:48

Игорь Байдов

Морские биологи впервые зафиксировали совместную охоту косаток и дельфинов

У побережья Канады морские биологи стали свидетелями необычного случая. Косатки и дельфины объединили свои силы, чтобы вместе охотиться на тихоокеанского лосося. Они погружались в темные глубины, а после удачной охоты делились пищей. Это первое задокументированное охотничье сотрудничество между двумя видами морских млекопитающих.

Биология

# дельфины

# интеллект китообразных

# китообразные

# косатки

# морские виды

# морские животные

# охота

13 декабря, 14:51

Игорь Байдов

В прошлом у Марса могла быть большая луна, которая управляла приливами

Астрономия

# вода на марсе

# Деймос

# марс

# спутники Марса

# Фобос

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

29 ноября, 12:42

Александр Березин

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

Космонавтика

# «Союз МС»

# Байконур

# корабль Союз

# космодром «Восточный»

# космодром Байконур

# космос

# Роскосмос

# Россия

Выбор редакции

27 ноября, 20:20

Максим Абдулаев

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

Археология

# алкоголь

# античность

# вино

# виноделие

# дрожжи

# история

# микробиология

[miniorange_social_login]

Да что доказывать когда в базе технологии нейронок это и так заложено, это всего лишь вероятнтстные машины, Т9 на стероидах, авторы вы когда подобное публикуете хотябы элементарную логику включали а не выдавали корпоративный пиар за сенсацию.

Ответить

Dron N

16.09.2025

Суть оригинальной работы была в демистификации галлюцинаций и демонстрации того, что текущий подход к требованию обязательного ответа приводит к увеличению галлюцинаций. Авторы описывают способы их уменьшения путём изменения бенчмарков, чтобы поощрялись ответы "я не знаю" когда модель не уверена, предлагают вводить пороги уверенности. Данная же статья ничего этого не отметила и в целом сильно манипулятивна и спекулятивна, основным выводом сделала якобы невозможность устранения галлюцинаций. Много других неточностей. Про уточняющие вопросы и рост вычислительной сложности в статье в таком виде ничего нет - похоже на галлюцинацию. Также в статье ничего нет про автопилоты. У них, насколько я знаю, множество дополнительных систем контроля и те методы поощрения неуверенности как раз в какой-то степени там и имплементированы. > "крайне трудно устранимым источником галлюцинаций оказались системы тестирования нейросетей. Любая из них может достигнуть нулевой частоты галлюцинаций, если ее жестко «наказывать» за неправильные ответы, снижая баллы. Чтобы повысить их, нейросеть быстро начнет писать «Я не знаю» в ответ на любой вопрос, который не содержался в ее обучающей выборке. Но в таком случае она будет отвечать «Я не знаю» в очень большом числе случаев (десятки процентов). С точки зрения стандартного потребителя переход от нейросети, уверенно рассуждающей на нужную ему тему, к той, что в каждом четвертом случае станет генерировать «Я не знаю», будет снижением качества продукта." В статье этого нет, нет приведенных процентов. Похоже на галлюцинацию. Как раз существующие тесты жёстко наказывают ошибки, не поощряют неуверенность и авторы описывают способы улучшения тестов. В общем, много драматизации про яды и автопилотов, видно что восприятие автора искажает факты и пересказ научных работ. Вместо того, чтобы отметить в целом бОльшую безопасность автопилотов по сравнению с людьми (кроме случаев плохого освещения), запугивает читателей ужасным ИИ.

Ответить

—

Александр Березин

16.09.2025

Dron, любой читатель может прочитать статью по ссылке и заметить, что вы неправы. Например, что неизбежность галлюцинаций отмечена авторами работы по ссылке легко убедится любой, владеющий английским хотя бы на уровне шестиклассника. "Также в статье ничего нет про автопилоты." В работе -- нет. В новостной статье выше -- конечно есть, контекст же мы должны дать. "У них, насколько я знаю, множество дополнительных систем контроля и те методы поощрения неуверенности как раз в какой-то степени там и имплементированы." Да-да. И торможения перед пустым месте на трассе оттуда же. Но галлюцинации почему-то не удалось ликвидировать и там. Даже введя торможения перед пустым местом, создающим риск въезжания в машину того, кто едет сзади за ней.

Ответить

ещё комментарии

Dron N

16.09.2025

Александр, основной вывод их работы в неизбежности галлюцинаций или может в способе их формализовать и предложенных способах их преодоления? Может вы исказили суть их работы всё-таки, придумав несуществующие там выводы?

Ответить

—

Александр Березин

16.09.2025

Dron, "основной вывод их работы в неизбежности галлюцинаций или может в способе их формализовать и предложенных способах их преодоления? " В разделе "Выводы" в работе нет формально нет ни того, ни другого: "This paper demystifies hallucinations in modern language models, from their origin during pretraining to their persistence through post-training. In pretraining, we show that generative errors parallel misclassifications in supervised learning, which are not mysterious, and naturally arise due to the minimization of cross-entropy loss..." и т.д. Там есть предположение, что предложенный ими подход может в будущем открыть дорогу к подавлению галлюцинаций. Но не к их полному исчезновению. Если просто пересказать куски из статьи не дав контекст, итоговая новость будет бесполезна, потому что читатель ее не поймет. Хотите этого? Читайте только ссылку на работу из моих новостей. Остальные читатели ознакомятся с контекстом.

Ответить

—

Dron N

16.09.2025

Александр, потому что учёные не мыслят настолько категорично без серьёзных к тому оснований. Будет исследование, будут результаты. Было бы крайне неосмотрительно заявлять, что их подход всё решит, но и утверждать что их статья "показала неустранимость галлюцинаций" - искажение фактов. Они вполне ясно выразились "это может устранить препятствия к подавлению галлюцинаций и открыть дверь для будущей работы над нюансированными языковыми моделями, например, с более богатой прагматической компетенцией". Я хочу чтоб не перевирался посыл исходных статей из-за предвзятости, только и всего.

Ответить

Paidamart

16.09.2025

Александр, автопилоты не являются языковыми моделями и поэтому явление галлюцинаций присущих именно LLM им не присущи. Поэтому приписывать в эту статью про галлюцинации больших языковых моделей - автопилоты неправильно. У них есть свои ошибки но это не галлюцинации а не верно интерпретированные показатели с камер. Проще говоря этот пример с автопилотами вообще не про ЛЛМ модели потому что автопилоты устроены по другому и намного сложнее.

Ответить

Иван Колупаев

16.09.2025

Dron, ни одна нейросеть не способна повторить автора NS 😁 Автор берет оригинальную статью лишь за основу а все остальное его собственные умозаключения. Таков путь.

Ответить

Dron N

16.09.2025

Ответить

—

Александр Березин

16.09.2025

Ответить

ещё комментарии

Dron N

16.09.2025

Ответить

—

Александр Березин

16.09.2025

Ответить

—

Dron N

16.09.2025

Ответить

Paidamart

16.09.2025

Ответить

Иван Колупаев

16.09.2025

Ответить

Виталий П

16.09.2025

Ответить

Исследователи из OpenAI показали неустранимость галлюцинаций нейросетей

По теме

Израильские ученые проверили нейросети на скрытый антисемитизм

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

Нейросети: зачем они обычному человеку?

Популярное

Комментарии

Последние новости:

Биологи составили масштабный рейтинг полезных и вредных бактерий кишечника

Ученые создали комбучу с повышенной антиоксидантной активностью

Римские завоеватели подорвали здоровье британцев на несколько столетий

Как приручить йод: ученые нашли новый метод защиты перовскитных солнечных батарей от разрушения

Инфографика: сравнение российского термоядерного реактора с ИТЭР

Советское наступление под Москвой: почему Красная армия победила, несмотря на немецкое превосходство

Как Россия разрабатывает материалы для реакторов нового поколения — от земных АЭС до космических систем. Интервью с Алексеем Дубом

Какой ядерный реактор строить: тест ваших предпочтений

Последние комментарии

Самые обсуждаемые

«Аффект зомби»: философ описал новое психоэмоциональное состояние современного человека

Инфографика: сравнение российского термоядерного реактора с ИТЭР

Советское наступление под Москвой: почему Красная армия победила, несмотря на немецкое превосходство

Ученые объяснили физический принцип, стоящий за развитием рака и старением клеток