Этот пост добавлен читателем Naked Science в раздел «Сообщество». Узнайте как это сделать по ссылке.

28.11.2025, 07:37

Рейтинг: +509

Посты: 1078

Рейтинг: частота «галлюцинаций» у популярных моделей ИИ

«Галлюцинацией» называют ситуации, когда большая языковая модель утверждает нечто как факт, хотя информация ложна или не имеет оснований. Причина проста: стандартные методы обучения поощряют догадки, а не признание неопределенности. Представьте экзамен с вариантами ответов: угадав, вы с большей вероятностью получите балл, чем оставив вопрос пустым. С ИИ происходит то же самое.

Сообщество

# ИИ

# инфографика

# нейросети

# Рейтинги

# статистика

# технологии

Рейтинг: частота «галлюцинаций» у популярных моделей ИИ / © Visual Capitalist

Инфографика выше, основанная на последнем исследовании от Terzo, демонстрирует, как часто различные модели ИИ выдают ошибки.

Чтобы оценить склонность к «галлюцинациям», исследователи предложили моделям от ведущих компаний фрагменты новостных текстов. Задача была одна — определить оригинальную статью, издание и URL.

Эксперимент поставили таким образом, что обычный поиск Google по этим фрагментам возвращал исходный материал в числе первых трех результатов. Затем ответы моделей проверяли на точность.

Согласно данным тестов Grok-3 показал худший результат — «галлюцинировал» в 94% случаев. Perplexity, напротив, продемонстрировал наибольшую точность.

Любопытно, что платные версии моделей справились хуже, чем их бесплатные аналоги. И почти все модели не выражали сомнений, даже когда ошибались.

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Дизайн исследования как у пятиклассников) задала всем моделям вопрос: выявлен патогенный вариант (миссенс-мутация) гетерозиготном состоянии в гене ANO5. К какому заболеванию это может привести? В данном случае модель должна сопоставить много фактов: в целом возможны 3 заболевания: ПКМД, миопатия Миоши и гнатодиафизарная дисплазия. Но первые два наследуются аутосомно-рецессивно и LLN модель должна сообразить, что при гетерозиготной мутации заболевание не разовьется, а вот для дисплазии как раз характерна миссенс мутация. Это сложная медицинская задачка, с которой процентов 95% врачей не справятся. Проверяем LLN: DeepSeek - наполовину, написал, что будет носителем ПМД и Миоши, но про дисплазию и не вспомнил GigaChat - накосячил Perplexity - верный ответ Qwen 3 max - информацию нашел верную, вывод не сделал Gpt4 - совсем слабо, даже заболевания не назвал Gemini - слабо, не назвал заболевания, все в общих чертах. Итого: единственный верный ответ дал Perplexity С более простым заданием (рассчитай доход по вкладу с ежемесячной капитализацией в России, если на вкладе 3 млн рублей под 16% за 233 дня) справились все, но только две модели размышляли и сообразили, дали два варианта: простой расчет и вычет налога на вклад (-13% от суммы, превышающей 210 000 дохода, она привязана к ключевой ставке), это DeepSeek и Perplexity

Ответить

Ilya Pronyashin

28.11.2025

Что принимается за ошибку. Ничего не понятно, но очень интересно. Perplexity - агрегатор, какая именно из его моделей использовалась? Sonet? Она самая слабая из всех, работает как поисковик, поэтому свойственных ИИ ошибок мало. Имхо.Статья шлак

Ответить

Иван Колупаев

28.11.2025

ну дык

Ответить

Кино Киноев

28.11.2025

познавательно

Ответить

say

29.11.2025

Ответить

Ilya Pronyashin

28.11.2025

Ответить

Иван Колупаев

28.11.2025

ну дык

Ответить

Кино Киноев

28.11.2025

познавательно

Ответить

Предстоящие мероприятия

Программа «Союз-Аполлон»: полет, подаривший надежду человечеству

Космонавтика и авиация

Москва

Центр «Архэ»

Санкт-Петербург

Лекция

18 Июл

600 ₽

Алкоголь и организм: мифы и реальность

ВСмысле

Онлайн

Лекция

18 Июл

Бесплатно

Введение в TTS (Text-to-Speech)

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

18 Июл

Бесплатно

Город через экран смартфона

Политехнический музей

Москва

Космонавтика и авиация

Москва

Экскурсия

19 Июл

500 ₽

Человеческое в технике

Политехнический музей

Москва

Лекция

19 Июл

500 ₽

Немыслимо: о возможностях и ограничениях нашего мышления

ВСмысле

Онлайн

Лекция

20 Июл

Бесплатно

Как кишечник управляет мозгом: еда, микробиота и ось кишечник-мозг

Курилка Гутенберга

Москва

Популярное

За сутки

За неделю

За месяц

17 июля, 10:00

Губкинский университет

Российское масло уменьшило расход топлива и увеличило ресурс газопоршневых двигателей

Ученые РГУ нефти и газа (НИУ) имени И. М. Губкина разработали синтетическое масло для газопоршневых двигателей, позволяющее снизить расход топливного метана на семь процентов. Продукт разработан в целях импортозамещения в сфере энергетики. Разработка открывает новые возможности распределенной энергетики на Крайнем Севере, Дальнем Востоке и других территориях без центральных сетей.

Губкинский университет

# двигатели

# материалы

# моторное масло

# промышленность

16 июля, 15:12

Evgenia Vavilova

Физики впервые воспроизвели в лаборатории процесс извлечения энергии из черной дыры

Процессы, сопровождающие жизнь черных дыр, интересуют не только теоретиков. Ученые уже знают, что энергия и частицы могут покидать черные дыры и теперь работают над способами эту энергию использовать.

Физика

# Роджер Пенроуз

# Черные дыры

# электромагнитные волны

# энергия

17 июля, 11:16

Игорь Байдов

У каменистой экзопланеты в зоне обитаемости впервые подтвердили атмосферу

До сих пор астрономы открывали атмосферы преимущественно у крупных экзопланет — горячих юпитеров, субнептунов и мини-нептунов. У потенциально пригодных для жизни миров, находящихся в зоне обитаемости, наличие газовой оболочки подтвердить не получалось. Теперь это удалось сделать команде американских ученых. Они получили первые убедительные свидетельства существования атмосферы у суперземли LHS 1140 b, расположенной приблизительно в 48 световых годах от Солнца. Открытие показало, что относительно небольшие экзопланеты возле красных карликов способны долгое время сохранять газовые оболочки, несмотря на активность своих звезд.

Астрономия

# атмосфера

# вода

# зона обитаемости

# красные карлики

# суперземли

# Суперземля

# экзопланета

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Кит живет двести лет, умеет пробивать головой полуметровый лед и поет океанский джаз голосом несмазанной дверной петли. Охотоморские гренландские киты — это не просто многотонные ледоколы. Это древние узники, которые остались жить в Охотском море со времен последнего оледенения. Это счастливцы, которые смогли пережить гарпуны китобоев XIX-XX веков, но сегодня уязвимы не меньше. Чтобы спасти этих поразительных китов, российским ученым и команде фонда «Природа и люди» приходится: считать хвосты, читать биографии по шрамам, прятать подростков от хищников, стрелять (спутниковыми метками) с парамоторов и тяжелых дронов. Рассказываем, как устроена жизнь гренландских китов России и кто помогает им не исчезнуть навсегда с лица планеты.

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

12 июля, 12:24

Марк Чернов

Интервальное голодание оказалось не хуже подсчета калорий — и оно значительно легче переносится

Ученые выяснили, почему интервальное голодание для многих оказывается эффективнее обычных диет. Исследование показало, что ограничение времени для приема пищи избавляет худеющего от изнуряющего ощущения жесткого контроля и при этом позволяет сбросить ровно столько же, сколько при скрупулезном подсчете калорий.

Медицина

# диета

# интервальное голодание

# лишний вес

# метаболизм

# питание

# похудение

13 июля, 20:02

Evgenia Vavilova

Физик создал маленькую Вселенную, для которой нет понятия времени

Деревья растут и люди стареют не потому, что идет время, а из-за происходящих внутри них процессов. Но можно ли сказать, что именно эти процессы порождают время? Ученый создал маленькую Вселенную, в которой дела обстоят именно так.

Физика

# время

# коденсат Бозе-Эйнштейна

# лазеры

# Общая теория относительности

# рубидий

# энтропия

25 июня, 16:20

Любовь С.

Физики уточнили возможные размеры Вселенной

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

Астрономия

# бесконечность

# вселенная

# геометрия

# пространство

# реликтовое излучение

# свет

# топология

25 июня, 15:09

Марк Чернов

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

Физика

# вода

# Молекулярная биология

# структура воды

# фазовые переходы

26 июня, 14:54

Максим Абдулаев

Начало деменции у пожилых собак определили по их походке

Американские ветеринары установили, что длина шага передних лап у пожилых собак отражает возрастные изменения в работе мозга. Когда у собак развивается деменция, шаги их передних лап становятся короче, причем эта связь не зависит от хронической боли в суставах.

Биология

# деменция

# походка

# собаки

# старение

[miniorange_social_login]

Рейтинг: частота «галлюцинаций» у популярных моделей ИИ

Комментарии

По теме

Ученый выявил «алгоритмическую шизофрению» нейросетей

Российские ученые научили нейросети писать безопасный код

Зачем человеку карта родинок и как она снижает риск рака

Популярное

Последние новости:

Врачи обнаружили связь между поеданием острого перца и опухолями пищевода

Стабильность, безопасность и удовольствие от простых вещей помогли избавиться от зависимости

В мозге нашли цепь, запускающую питье после стресса

Астрофизики установили причины ритмичных вспышек блазара Тон 599

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Последние комментарии

Самые обсуждаемые

Эксперимент объяснил миф о женской многозадачности

Физики впервые объяснили, почему золото не тускнеет тысячелетиями

Квантовый «отскок» помог объяснить, почему ранняя Вселенная стала однородной

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только