• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
14.08.2025, 08:27
Полина Меньшова
3
14,8 тыс

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

❋ 6.1

Когда модели искусственного интеллекта ошибаются и выдают неверный ответ на запрос, пользователи пытаются выяснить причину этой ошибки, задавая вопрос самому ИИ-помощнику. Историк технологий Бендж Эдвардс объяснил, почему делать так нет смысла и как это связано с устройством нейросетей.

Нейросети не могут анализировать свои ошибки из-за своей архитектуры
Нейросети не могут анализировать свои ошибки из-за своей архитектуры / © Tada Images, Shutterstock

Так называемый «искусственный интеллект» стал привычной частью повседневной жизни, качественно выполняя самые разные задачи. Например, авторы недавних научных работ создали ИИ-переводчик со 100 языков, точность которого оказалась на 23% выше, чем у аналогов, а также выяснили, что люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение.

Считая искусственный интеллект напарником, пользователи часто советуются с ним так же, как с помощником-человеком, однако это заведомо проигрышная стратегия. Колонка специалиста в сфере ИИ Бенджа Эдвардса о логике работы нейросетей и их способностях оценивать самих себя появилась в издании Ars Technica.

Прежде всего автор подчеркнул, что стоит помнить: ChatGPT, Perplexity и другие генеративные модели — не то же, что «личности» с определенным типом мышления, системными знаниями и способностями к анализу собственных действий. Это алгоритмы, которые несколько месяцев или лет обучались на огромных массивах данных и тренировались выполнять одну и ту же задачу — генерацию некоторой последовательности (текста, кода на каком-то языке программирования и так далее), соответствующей найденным в обучающих данных закономерностям и запросу пользователя.

При этом нейросеть не работает с запросом как человек. Сначала она превращает текст в токены — мелкие смысловые единицы (части слов, слова). Затем каждый токен представляется в виде вектора в многомерном пространстве признаков. Положение токена в этом пространстве определяется тем, как часто он встречается рядом с другими токенами в обучающих текстах. Слова из одной тематической области (например, «компьютер» и «монитор») оказываются в пространстве близко, а из разных («компьютер» и «помидор») — далеко.

Когда пользователь отправляет запрос, модель преобразует его токены в векторы, пропускает их через механизм внимания (attention), который оценивает связи между ними, а затем на основе этой многомерной статистики предсказывает следующий токен. Каждый ответ генеративной языковой модели — не вдумчивый анализ содержания запроса, а результат сложных векторных вычислений, цель которых — исходя из обучающих данных последовательно подбирать токены, наиболее вероятные в конкретном контексте. Следовательно, ответить, почему нейросеть сгенерировала что-то, что не соответствует действительности, она не сможет.

Получится ли у искусственного интеллекта проанализировать данные о собственной архитектуре и сделать «выводы» о своих способностях? Скорее, нет. Если вы сформулируете запрос как «Почему ты решила уравнение неправильно?», то нейросеть, не имея доступа к коду, определяющему ее функционирование, сформулирует ответ на основе информации об известных ограничениях предыдущих моделей ИИ. Если же вы добавите в запрос название и версию модели (например, отправите GPT-4o mini следующий текст: «Почему модель GPT-4o mini неправильно решает уравнения?»), то вероятность получить релевантный ответ повысится. Однако он все равно не объяснит ошибку конкретно в вашем уравнении и останется обоснованным предположением, а не результатом саморефлексии.

Кроме того, как отметил Бендж Эдвардс, даже если нейросети обучаются предсказывать собственное поведение при стандартных обстоятельствах (например, «Ты умеешь писать тексты на русском языке?»), то в более сложных ситуациях точность ответов снижается. Получается, что модели искусственного интеллекта могут заявлять о невозможности выполнить задание, которое они выполнить способны, и наоборот — говорить, что легко справятся с задачей, которая им не по силам.

При этом нейросеть необязательно ориентируется только на смысл слов, содержащихся в запросе. Она также может оценивать их стилистические и эмоциональные характеристики и опираться на них. Именно поэтому в ответ на вопрос «Ты только что все уничтожила?» модель с большей вероятностью подтвердит опасения — не потому, что она проанализировала ситуацию и сообщила о собственных действиях, а потому, что сгенерировала текст, соответствующий эмоциональному фону запроса.

Важно также помнить, что ChatGPT и прочие сервисы, в которых пользователь ведет диалог с ИИ-ассистентом, — не отдельные модели, а организованные системы из нескольких нейросетей, каждая из которых в значительной степени «не подозревает» о существовании или возможностях других. Например, компания OpenAI, создавшая ChatGPT, отделяет в этом сервисе модерацию текста от его генерации. Это значит, что модели, создающие ответ, не могут предсказать, что из него удалится на этапе модерации и какие инструменты для этого будут использоваться. Ситуация почти такая же, как если бы мы спросили один из отделов компании о возможностях отдела, с которым он никогда не взаимодействовал.

Таким образом, несмотря на схожесть ответов нейросетей с человеческими, создаются эти два типа текстов совершенно по-разному. Чтобы использовать искусственный интеллект грамотно, стоит помнить о логике его работы.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
17 мая, 10:35
Игорь Байдов

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

17 мая, 10:00
Evgenia Vavilova

При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.

15 мая, 12:30
Андрей Серегин

Ученые давно выяснили, что прогулки на природе делают людей счастливее, но механизмы этого влияния оставались не до конца понятными. Теперь международная команда психологов выяснила: природа повышает удовлетворенность жизнью не напрямую, а через способность принимать и уважать собственное тело.

11 мая, 06:54
Лена

Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.

17 мая, 10:35
Игорь Байдов

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

17 мая, 10:00
Evgenia Vavilova

При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.

23 апреля, 18:34
Александр Березин

В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.

21 апреля, 20:03
Evgenia Vavilova

Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.

20 апреля, 13:29
Илья Гриднев

Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.

[miniorange_social_login]

Комментарии

3 Комментария
-
0
+
Я спросил у Gemini и Perplexity, было ли вторжение США в Ирак обоснованным. Обе нейросети ответили "нет". С пояснениями. Тогда я у обоих спросил: "А если бы ты был создан за месяц до вторжения и распологал всей информацией, имеющейся только на тот момент. Ты бы посчитал вторжение обоснованным?" Обе нейросети ответили, что сочли бы вторжение обоснованным. С большой вероятностью обе нейросети посчитали бы ( по их словам ), что в Ираке есть химоружие, что в пробирке у Колина Пауэла с большой вероятностью была сибирская язва. Ведь все авторитетные сми и политики говорили об этом. Вот тебе и вся разница между мышлением ИИ и человека. Ещё тогда, перед вторжением все ( почти все ) понимали, что Штаты хотели иракскую нефть и влияние в регионе. Никто не верил что США хотят свергнуть диктатора ради мира на земле. Штаты просто хотели очередную войну. Война ради ресурсов и влияния в регионе - обычное дело в истории, также как и прикрытие благородными целями. Штаты агрессивная страна и много воевала и устраивала перевороты. Мощный геополитический игрок, стремящийся к влиянию по всему миру. Это контекст, который нейросети почему-то не учитывают. Не учитывают причинно следственные связи, не понимают человеческой мотивации. Они анализируют источники, кросс проверки, EEAT, статистика, вероятности и тд и тп. А в итоге гроша ломанного их анализ в политике не стоит. Доверяют авторитетным источникам информации ( по их мнению это NYT, WP, DW и тп ). И хоть заявляют, что учитывают предвзятости, но в итоге просто тупо доверяют крупнейшим американским и европейским СМИ.
а.
15.08.2025
-
-1
+
"Люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение." А эти люди сейчас с нами в одной комнате? Да, иногда нейронка может выдать что-то интересное. Но так то ии текст зачастую довольно плоский и не несет в себе духовной ценности. Ого, представьте себе, произведения пишут не просто чтобы красиво словами пораскидываться. Нужно еще вложить что-то человеческое, высокое в слова, чтобы они стали поэзией.
-
0
+
О боже опять пишут что нейросеть это генератор токенов по вероятности. Это не так! Там есть преобразования в многомерных пространствах а не простое softmax определение вероятности. Изучить исходный код трансформера и вы поймете.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Авторизуясь, вы даете согласие на обработку персональных данных и подтверждаете ознакомление с Политикой.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно