• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
14 августа, 08:27
Полина Меньшова
2
14 552

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

❋ 6.1

Когда модели искусственного интеллекта ошибаются и выдают неверный ответ на запрос, пользователи пытаются выяснить причину этой ошибки, задавая вопрос самому ИИ-помощнику. Историк технологий Бендж Эдвардс объяснил, почему делать так нет смысла и как это связано с устройством нейросетей.

Нейросети не могут анализировать свои ошибки из-за своей архитектуры
Нейросети не могут анализировать свои ошибки из-за своей архитектуры / © Tada Images, Shutterstock

Так называемый «искусственный интеллект» стал привычной частью повседневной жизни, качественно выполняя самые разные задачи. Например, авторы недавних научных работ создали ИИ-переводчик со 100 языков, точность которого оказалась на 23% выше, чем у аналогов, а также выяснили, что люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение.

Считая искусственный интеллект напарником, пользователи часто советуются с ним так же, как с помощником-человеком, однако это заведомо проигрышная стратегия. Колонка специалиста в сфере ИИ Бенджа Эдвардса о логике работы нейросетей и их способностях оценивать самих себя появилась в издании Ars Technica.

Прежде всего автор подчеркнул, что стоит помнить: ChatGPT, Perplexity и другие генеративные модели — не то же, что «личности» с определенным типом мышления, системными знаниями и способностями к анализу собственных действий. Это алгоритмы, которые несколько месяцев или лет обучались на огромных массивах данных и тренировались выполнять одну и ту же задачу — генерацию некоторой последовательности (текста, кода на каком-то языке программирования и так далее), соответствующей найденным в обучающих данных закономерностям и запросу пользователя.

При этом нейросеть не работает с запросом как человек. Она делит текст на более мелкие смысловые единицы — токены, а затем каждый токен кодирует исходя из информации о том, как часто он встречается рядом с каждым другим токеном в массиве обучающих текстов. Слова из одной тематической области (например, «компьютер» и «монитор») встречаются рядом чаще, чем слова из разных сфер (допустим, «компьютер» и «помидор»). Соответственно, когда пользователь просит модель искусственного интеллекта ответить на вопрос, она оценивает информацию о токенах, из которых этот запрос состоит, дополняет ею обучающие данные и генерирует ответ, ставя рядом друг с другом те единицы, которые, исходя из статистики, с большей вероятностью сочетаются.

Каждый ответ генеративной языковой модели — не результат вдумчивого анализа содержания запроса или найденных источников, а попытка расположить смысловые единицы так, как они с наибольшей вероятностью располагались бы в обучающих данных. Следовательно, ответить, почему нейросеть сгенерировала что-то, что не соответствует действительности, она не сможет.

Получится ли у искусственного интеллекта проанализировать данные о собственной архитектуре и сделать «выводы» о своих способностях? Скорее, нет. Если вы сформулируете запрос как «Почему ты решила уравнение неправильно?», то нейросеть, не имея доступа к коду, определяющему ее функционирование, сформулирует ответ на основе информации об известных ограничениях предыдущих моделей ИИ. Если же вы добавите в запрос название и версию модели (например, отправите GPT-4o mini следующий текст: «Почему модель GPT-4o mini неправильно решает уравнения?»), то вероятность получить релевантный ответ повысится. Однако он все равно не объяснит ошибку конкретно в вашем уравнении и останется обоснованным предположением, а не результатом саморефлексии.

Кроме того, как отметил Бендж Эдвардс, даже если нейросети обучаются предсказывать собственное поведение при стандартных обстоятельствах (например, «Ты умеешь писать тексты на русском языке?»), то в более сложных ситуациях точность ответов снижается. Получается, что модели искусственного интеллекта могут заявлять о невозможности выполнить задание, которое они выполнить способны, и наоборот — говорить, что легко справятся с задачей, которая им не по силам.

При этом нейросеть необязательно ориентируется только на смысл слов, содержащихся в запросе. Она также может оценивать их стилистические и эмоциональные характеристики и опираться на них. Именно поэтому в ответ на вопрос «Ты только что все уничтожила?» модель с большей вероятностью подтвердит опасения — не потому, что она проанализировала ситуацию и сообщила о собственных действиях, а потому, что сгенерировала текст, соответствующий эмоциональному фону запроса.

Важно также помнить, что ChatGPT и прочие сервисы, в которых пользователь ведет диалог с ИИ-ассистентом, — не отдельные модели, а организованные системы из нескольких нейросетей, каждая из которых в значительной степени «не подозревает» о существовании или возможностях других. Например, компания OpenAI, создавшая ChatGPT, отделяет в этом сервисе модерацию текста от его генерации. Это значит, что модели, создающие ответ, не могут предсказать, что из него удалится на этапе модерации и какие инструменты для этого будут использоваться. Ситуация почти такая же, как если бы мы спросили один из отделов компании о возможностях отдела, с которым он никогда не взаимодействовал.

Таким образом, несмотря на схожесть ответов нейросетей с человеческими, создаются эти два типа текстов совершенно по-разному. Чтобы использовать искусственный интеллект грамотно, стоит помнить о логике его работы.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
27 сентября, 14:07
Игорь Байдов

Резкий крен, падение в воздушную яму и тревожный сигнал ремней безопасности — знакомые ощущения для любого, кто часто летает. Для миллионов пассажиров турбулентность остается главным источником дискомфорта и страха в полете. Но авторы нового исследования обещают перевести ее из разряда непредсказуемых явлений в область точной науки. Они заявили о создании, возможно, самой передовой математической модели турбулентности, которая поможет сделать полет гораздо спокойнее.

29 сентября, 07:55
Игорь Байдов

Одни романы, едва появившись на свет, мгновенно взрывают чарты книжных рейтингов, но через пару лет о них забывают все, кроме литературоведов. Другие, не так удачно стартовавшие в год публикации, продолжают завоевывать сердца новых читателей даже спустя век. В чем их секрет? Оказывается, разгадка кроется не только в сюжете, но и в самой ткани повествования.

29 сентября, 07:45
Любовь С.

Один из крупнейших ударных кратеров на видимой стороне Луны — Море Ясности (Mare Serenitatis) — образовался на 300 миллионов лет раньше, чем считалось. К такому выводу ученые пришли, проанализировав камень, доставленный на Землю астронавтами «Аполлона-17» в 1972 году. Открытие может привести к пересмотру ранней истории Солнечной системы.

26 сентября, 11:41
ИИМК РАН

Археологи Института истории материальной культуры РАН (ИИМК РАН), при поддержке фонда «История отечества» в ходе раскопок обнаружили на всемирно известной стоянке каменного века Костенки-17 в Воронежской области редчайшие украшения из зубов песца и окаменелой раковины, а также уникальный для этого времени нуклеус из бивня мамонта для снятия заготовок.

27 сентября, 14:07
Игорь Байдов

Резкий крен, падение в воздушную яму и тревожный сигнал ремней безопасности — знакомые ощущения для любого, кто часто летает. Для миллионов пассажиров турбулентность остается главным источником дискомфорта и страха в полете. Но авторы нового исследования обещают перевести ее из разряда непредсказуемых явлений в область точной науки. Они заявили о создании, возможно, самой передовой математической модели турбулентности, которая поможет сделать полет гораздо спокойнее.

26 сентября, 11:17
Александр Березин

Вопреки прогнозам о деградации тропических джунглей из-за антропогенных изменений климата, их деревья быстро наращивают биомассу и размеры. Причем это относится и к крупным, и к более мелким из них.

20 сентября, 08:52
Александр Березин

Посадка, включая выгорание куска степи, прошла штатно, но часть грызунов на борту погибли. Правда, погубила их не повышенная космическая радиация полярной орбиты, влияние которой на млекопитающих планировали выявить в миссии, а более банальные причины.

12 сентября, 14:03
ТюмГУ

Исследования самодержавия могут пролить свет на феномен, исконно свойственный российской государственности, а значит, переосмыслить исторический путь России и выработку новых направлений развития, к такому выводу пришел ученый ТюмГУ.

9 сентября, 11:03
Адель Романова

Третий известный межзвездный объект 3I/ATLAS летит примерно вдвое быстрее обоих своих предшественников. По расчетам, его вряд ли могло выбросить из родной планетной системы с подобной скоростью, и так разогнаться по пути он тоже не мог.

[miniorange_social_login]

Комментарии

2 Комментария
а.
15.08.2025
-
-1
+
"Люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение." А эти люди сейчас с нами в одной комнате? Да, иногда нейронка может выдать что-то интересное. Но так то ии текст зачастую довольно плоский и не несет в себе духовной ценности. Ого, представьте себе, произведения пишут не просто чтобы красиво словами пораскидываться. Нужно еще вложить что-то человеческое, высокое в слова, чтобы они стали поэзией.
-
0
+
О боже опять пишут что нейросеть это генератор токенов по вероятности. Это не так! Там есть преобразования в многомерных пространствах а не простое softmax определение вероятности. Изучить исходный код трансформера и вы поймете.
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно