• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
14.08.2025, 08:27
Полина Меньшова
3
14,8 тыс

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

❋ 6.1

Когда модели искусственного интеллекта ошибаются и выдают неверный ответ на запрос, пользователи пытаются выяснить причину этой ошибки, задавая вопрос самому ИИ-помощнику. Историк технологий Бендж Эдвардс объяснил, почему делать так нет смысла и как это связано с устройством нейросетей.

Нейросети не могут анализировать свои ошибки из-за своей архитектуры
Нейросети не могут анализировать свои ошибки из-за своей архитектуры / © Tada Images, Shutterstock

Так называемый «искусственный интеллект» стал привычной частью повседневной жизни, качественно выполняя самые разные задачи. Например, авторы недавних научных работ создали ИИ-переводчик со 100 языков, точность которого оказалась на 23% выше, чем у аналогов, а также выяснили, что люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение.

Считая искусственный интеллект напарником, пользователи часто советуются с ним так же, как с помощником-человеком, однако это заведомо проигрышная стратегия. Колонка специалиста в сфере ИИ Бенджа Эдвардса о логике работы нейросетей и их способностях оценивать самих себя появилась в издании Ars Technica.

Прежде всего автор подчеркнул, что стоит помнить: ChatGPT, Perplexity и другие генеративные модели — не то же, что «личности» с определенным типом мышления, системными знаниями и способностями к анализу собственных действий. Это алгоритмы, которые несколько месяцев или лет обучались на огромных массивах данных и тренировались выполнять одну и ту же задачу — генерацию некоторой последовательности (текста, кода на каком-то языке программирования и так далее), соответствующей найденным в обучающих данных закономерностям и запросу пользователя.

При этом нейросеть не работает с запросом как человек. Сначала она превращает текст в токены — мелкие смысловые единицы (части слов, слова). Затем каждый токен представляется в виде вектора в многомерном пространстве признаков. Положение токена в этом пространстве определяется тем, как часто он встречается рядом с другими токенами в обучающих текстах. Слова из одной тематической области (например, «компьютер» и «монитор») оказываются в пространстве близко, а из разных («компьютер» и «помидор») — далеко.

Когда пользователь отправляет запрос, модель преобразует его токены в векторы, пропускает их через механизм внимания (attention), который оценивает связи между ними, а затем на основе этой многомерной статистики предсказывает следующий токен. Каждый ответ генеративной языковой модели — не вдумчивый анализ содержания запроса, а результат сложных векторных вычислений, цель которых — исходя из обучающих данных последовательно подбирать токены, наиболее вероятные в конкретном контексте. Следовательно, ответить, почему нейросеть сгенерировала что-то, что не соответствует действительности, она не сможет.

Получится ли у искусственного интеллекта проанализировать данные о собственной архитектуре и сделать «выводы» о своих способностях? Скорее, нет. Если вы сформулируете запрос как «Почему ты решила уравнение неправильно?», то нейросеть, не имея доступа к коду, определяющему ее функционирование, сформулирует ответ на основе информации об известных ограничениях предыдущих моделей ИИ. Если же вы добавите в запрос название и версию модели (например, отправите GPT-4o mini следующий текст: «Почему модель GPT-4o mini неправильно решает уравнения?»), то вероятность получить релевантный ответ повысится. Однако он все равно не объяснит ошибку конкретно в вашем уравнении и останется обоснованным предположением, а не результатом саморефлексии.

Кроме того, как отметил Бендж Эдвардс, даже если нейросети обучаются предсказывать собственное поведение при стандартных обстоятельствах (например, «Ты умеешь писать тексты на русском языке?»), то в более сложных ситуациях точность ответов снижается. Получается, что модели искусственного интеллекта могут заявлять о невозможности выполнить задание, которое они выполнить способны, и наоборот — говорить, что легко справятся с задачей, которая им не по силам.

При этом нейросеть необязательно ориентируется только на смысл слов, содержащихся в запросе. Она также может оценивать их стилистические и эмоциональные характеристики и опираться на них. Именно поэтому в ответ на вопрос «Ты только что все уничтожила?» модель с большей вероятностью подтвердит опасения — не потому, что она проанализировала ситуацию и сообщила о собственных действиях, а потому, что сгенерировала текст, соответствующий эмоциональному фону запроса.

Важно также помнить, что ChatGPT и прочие сервисы, в которых пользователь ведет диалог с ИИ-ассистентом, — не отдельные модели, а организованные системы из нескольких нейросетей, каждая из которых в значительной степени «не подозревает» о существовании или возможностях других. Например, компания OpenAI, создавшая ChatGPT, отделяет в этом сервисе модерацию текста от его генерации. Это значит, что модели, создающие ответ, не могут предсказать, что из него удалится на этапе модерации и какие инструменты для этого будут использоваться. Ситуация почти такая же, как если бы мы спросили один из отделов компании о возможностях отдела, с которым он никогда не взаимодействовал.

Таким образом, несмотря на схожесть ответов нейросетей с человеческими, создаются эти два типа текстов совершенно по-разному. Чтобы использовать искусственный интеллект грамотно, стоит помнить о логике его работы.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
28 июня, 16:58
Alexander Baulin

Терраформировать Марс — то есть превратить в мир, где можно жить без защитных куполов — мечта человечества с того момента, как стало понятно, что это холодная планета с призрачной бескислородной атмосферой. Сейчас главный хедлайнер ее освоения — Илон Маск, компания SpaceX которого планирует первые полеты туда уже в 2028 году. Многие энтузиасты вспоминают слова Маска 14-летней давности: Красную планету надо лишь «подремонтировать», чтобы ходить без скафандра. Но между полетом и прогулками по городу-саду на Марсе лежит огромная пропасть. Пару лет назад Naked Science рассматривал положительный сценарий терраформирования. Пришло время подсчитать, сколько же лет и ресурсов потребуется.

30 июня, 16:52
Понамарева Валерия

Самый маленький дневной хищник Африки впервые попал под наблюдение с помощью GPS-трекеров. Ученые выяснили, что для выкармливания птенцов ему нужен участок почти в 14 раз меньше, чем у степной пустельги — ближайшего «рекордсмена» среди изученных птиц.

29 июня, 12:34
Илья Гриднев

Биологи нашли особый тип стволовых клеток, которые просыпаются в среднем возрасте и активно производят новый жир на животе. Открытие сделали благодаря масштабным экспериментам на мышах и анализу человеческих тканей. Результат объяснил природу возрастного ожирения и дал новую цель для будущих лекарств.

25 июня, 16:20
Любовь С.

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

28 июня, 16:58
Alexander Baulin

Терраформировать Марс — то есть превратить в мир, где можно жить без защитных куполов — мечта человечества с того момента, как стало понятно, что это холодная планета с призрачной бескислородной атмосферой. Сейчас главный хедлайнер ее освоения — Илон Маск, компания SpaceX которого планирует первые полеты туда уже в 2028 году. Многие энтузиасты вспоминают слова Маска 14-летней давности: Красную планету надо лишь «подремонтировать», чтобы ходить без скафандра. Но между полетом и прогулками по городу-саду на Марсе лежит огромная пропасть. Пару лет назад Naked Science рассматривал положительный сценарий терраформирования. Пришло время подсчитать, сколько же лет и ресурсов потребуется.

29 июня, 12:34
Илья Гриднев

Биологи нашли особый тип стволовых клеток, которые просыпаются в среднем возрасте и активно производят новый жир на животе. Открытие сделали благодаря масштабным экспериментам на мышах и анализу человеческих тканей. Результат объяснил природу возрастного ожирения и дал новую цель для будущих лекарств.

10 июня, 11:51
Александр Березин

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

25 июня, 16:20
Любовь С.

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

25 июня, 15:09
Марк Чернов

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

[miniorange_social_login]

Комментарии

3 Комментария
-
0
+
Я спросил у Gemini и Perplexity, было ли вторжение США в Ирак обоснованным. Обе нейросети ответили "нет". С пояснениями. Тогда я у обоих спросил: "А если бы ты был создан за месяц до вторжения и распологал всей информацией, имеющейся только на тот момент. Ты бы посчитал вторжение обоснованным?" Обе нейросети ответили, что сочли бы вторжение обоснованным. С большой вероятностью обе нейросети посчитали бы ( по их словам ), что в Ираке есть химоружие, что в пробирке у Колина Пауэла с большой вероятностью была сибирская язва. Ведь все авторитетные сми и политики говорили об этом. Вот тебе и вся разница между мышлением ИИ и человека. Ещё тогда, перед вторжением все ( почти все ) понимали, что Штаты хотели иракскую нефть и влияние в регионе. Никто не верил что США хотят свергнуть диктатора ради мира на земле. Штаты просто хотели очередную войну. Война ради ресурсов и влияния в регионе - обычное дело в истории, также как и прикрытие благородными целями. Штаты агрессивная страна и много воевала и устраивала перевороты. Мощный геополитический игрок, стремящийся к влиянию по всему миру. Это контекст, который нейросети почему-то не учитывают. Не учитывают причинно следственные связи, не понимают человеческой мотивации. Они анализируют источники, кросс проверки, EEAT, статистика, вероятности и тд и тп. А в итоге гроша ломанного их анализ в политике не стоит. Доверяют авторитетным источникам информации ( по их мнению это NYT, WP, DW и тп ). И хоть заявляют, что учитывают предвзятости, но в итоге просто тупо доверяют крупнейшим американским и европейским СМИ.
а.
15.08.2025
-
-1
+
"Люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение." А эти люди сейчас с нами в одной комнате? Да, иногда нейронка может выдать что-то интересное. Но так то ии текст зачастую довольно плоский и не несет в себе духовной ценности. Ого, представьте себе, произведения пишут не просто чтобы красиво словами пораскидываться. Нужно еще вложить что-то человеческое, высокое в слова, чтобы они стали поэзией.
-
0
+
О боже опять пишут что нейросеть это генератор токенов по вероятности. Это не так! Там есть преобразования в многомерных пространствах а не простое softmax определение вероятности. Изучить исходный код трансформера и вы поймете.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Ошибка авторизации
По закону на российских сайтах теперь нельзя авторизовываться с помощью иностранных сервисов. Используйте другой способ или восстановите доступ по почте.
Восстановить доступ
Войти по-другому
Вход через почту
Введите привязанную к соцсети почту, чтобы восстановить доступ или получить одноразовую ссылку для входа на сайт.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно