14 августа, 08:27

Полина Меньшова

14,6 тыс

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

❋ 6.1

Когда модели искусственного интеллекта ошибаются и выдают неверный ответ на запрос, пользователи пытаются выяснить причину этой ошибки, задавая вопрос самому ИИ-помощнику. Историк технологий Бендж Эдвардс объяснил, почему делать так нет смысла и как это связано с устройством нейросетей.

Технологии

# ChatGPT

# OpenAI

# искусственный интеллект

# нейросети

Нейросети не могут анализировать свои ошибки из-за своей архитектуры / © Tada Images, Shutterstock

Так называемый «искусственный интеллект» стал привычной частью повседневной жизни, качественно выполняя самые разные задачи. Например, авторы недавних научных работ создали ИИ-переводчик со 100 языков, точность которого оказалась на 23% выше, чем у аналогов, а также выяснили, что люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение.

Считая искусственный интеллект напарником, пользователи часто советуются с ним так же, как с помощником-человеком, однако это заведомо проигрышная стратегия. Колонка специалиста в сфере ИИ Бенджа Эдвардса о логике работы нейросетей и их способностях оценивать самих себя появилась в издании Ars Technica.

Прежде всего автор подчеркнул, что стоит помнить: ChatGPT, Perplexity и другие генеративные модели — не то же, что «личности» с определенным типом мышления, системными знаниями и способностями к анализу собственных действий. Это алгоритмы, которые несколько месяцев или лет обучались на огромных массивах данных и тренировались выполнять одну и ту же задачу — генерацию некоторой последовательности (текста, кода на каком-то языке программирования и так далее), соответствующей найденным в обучающих данных закономерностям и запросу пользователя.

При этом нейросеть не работает с запросом как человек. Она делит текст на более мелкие смысловые единицы — токены, а затем каждый токен кодирует исходя из информации о том, как часто он встречается рядом с каждым другим токеном в массиве обучающих текстов. Слова из одной тематической области (например, «компьютер» и «монитор») встречаются рядом чаще, чем слова из разных сфер (допустим, «компьютер» и «помидор»). Соответственно, когда пользователь просит модель искусственного интеллекта ответить на вопрос, она оценивает информацию о токенах, из которых этот запрос состоит, дополняет ею обучающие данные и генерирует ответ, ставя рядом друг с другом те единицы, которые, исходя из статистики, с большей вероятностью сочетаются.

Каждый ответ генеративной языковой модели — не результат вдумчивого анализа содержания запроса или найденных источников, а попытка расположить смысловые единицы так, как они с наибольшей вероятностью располагались бы в обучающих данных. Следовательно, ответить, почему нейросеть сгенерировала что-то, что не соответствует действительности, она не сможет.

Получится ли у искусственного интеллекта проанализировать данные о собственной архитектуре и сделать «выводы» о своих способностях? Скорее, нет. Если вы сформулируете запрос как «Почему ты решила уравнение неправильно?», то нейросеть, не имея доступа к коду, определяющему ее функционирование, сформулирует ответ на основе информации об известных ограничениях предыдущих моделей ИИ. Если же вы добавите в запрос название и версию модели (например, отправите GPT-4o mini следующий текст: «Почему модель GPT-4o mini неправильно решает уравнения?»), то вероятность получить релевантный ответ повысится. Однако он все равно не объяснит ошибку конкретно в вашем уравнении и останется обоснованным предположением, а не результатом саморефлексии.

Кроме того, как отметил Бендж Эдвардс, даже если нейросети обучаются предсказывать собственное поведение при стандартных обстоятельствах (например, «Ты умеешь писать тексты на русском языке?»), то в более сложных ситуациях точность ответов снижается. Получается, что модели искусственного интеллекта могут заявлять о невозможности выполнить задание, которое они выполнить способны, и наоборот — говорить, что легко справятся с задачей, которая им не по силам.

При этом нейросеть необязательно ориентируется только на смысл слов, содержащихся в запросе. Она также может оценивать их стилистические и эмоциональные характеристики и опираться на них. Именно поэтому в ответ на вопрос «Ты только что все уничтожила?» модель с большей вероятностью подтвердит опасения — не потому, что она проанализировала ситуацию и сообщила о собственных действиях, а потому, что сгенерировала текст, соответствующий эмоциональному фону запроса.

Важно также помнить, что ChatGPT и прочие сервисы, в которых пользователь ведет диалог с ИИ-ассистентом, — не отдельные модели, а организованные системы из нескольких нейросетей, каждая из которых в значительной степени «не подозревает» о существовании или возможностях других. Например, компания OpenAI, создавшая ChatGPT, отделяет в этом сервисе модерацию текста от его генерации. Это значит, что модели, создающие ответ, не могут предсказать, что из него удалится на этапе модерации и какие инструменты для этого будут использоваться. Ситуация почти такая же, как если бы мы спросили один из отделов компании о возможностях отдела, с которым он никогда не взаимодействовал.

Таким образом, несмотря на схожесть ответов нейросетей с человеческими, создаются эти два типа текстов совершенно по-разному. Чтобы использовать искусственный интеллект грамотно, стоит помнить о логике его работы.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.

Технологии

# ChatGPT

# OpenAI

# искусственный интеллект

# нейросети

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Конфуций как политический деятель и мыслитель

Российская государственная библиотека

Москва

Medio Modo

Москва

ВДНХ

Москва

Лекция

15 Ноя

Бесплатно

Чего Микита хотел от Маланьи? Порядки и нравы Древнего Новгорода

Центр славянской письменности «Слово»

Москва

Лекция

15 Ноя

Бесплатно

Вызовы и будущее коррекции дефектов кожи

Парк «Зарядье»

Москва

Лекция

15 Ноя

Бесплатно

Ускорительный комплекс NICA

Парк «Зарядье»

Москва

Лекция

15 Ноя

Бесплатно

Большой Брат в Москве: зачем город собирает данные о жителях

ВДНХ

Москва

Лекция

15 Ноя

Бесплатно

Энергия и Буран — последние шедевры советской космонавтики

Библиотека Планетарий 1

Санкт-Петербург

Лекция

15 Ноя

Бесплатно

Как накормить мир: свет, вода и немного науки

Парк «Зарядье»

Москва

Популярное

За сутки

За неделю

За месяц

12 ноября, 10:47

Максим Абдулаев

Бактерии со сломанными жгутиками поплыли вперед на собственных продуктах жизнедеятельности

Ученые открыли новый, ранее неизвестный способ передвижения бактерий по поверхностям, для которого не нужны жгутики. Эти микроорганизмы на краю колонии переваривают сахара, выделяют метаболиты и создают осмотическое давление. Оно вызывает микроскопическое «цунами», и на нем бактерии катятся вперед.

Биология

# бактерии

# жгутики

# локомоция

# микробиология

12 ноября, 13:08

Александр Березин

Зажечь Солнце на Земле: как Россия в одиночку строит свой ИТЭР – интервью с Андреем Аникеевым

Термояд начнет вырабатывать электричество через 20 лет — так говорили с 1950-х, но этого все так и не происходит. Почему? В чем принципиальные сложности на этом пути? Чего добивается «Росатом» в проекте ИТЭР и почему параллельно уже начал работу по российскому термоядерному реактору ТРТ? Руководитель проектного офиса по управляемому термоядерному синтезу «Наука и инновации» госкорпорации «Росатом» Андрей Аникеев ответил на наши вопросы.

С точки зрения науки

# ИТЭР

# Россия

# термоядерная энергетика

# технологии

# токамаки

Выбор редакции

13 ноября, 14:02

Адель Романова

Отсутствие радиосигналов из системы с «признаками жизни» повысило шансы на ее обитаемость

Экзопланета K2-18 b недавно прославилась благодаря обнаружению в ее атмосфере гипотетических продуктов жизнедеятельности фитопланктона. В это трудно поверить, в том числе потому, что ее родительская звезда — красный карлик, а такие звезды известны своими экстремальными вспышками. Новые наблюдения показали, что K2-18 отличается необычным спокойствием.

Астрономия

# K2-18b

# внеземная жизнь

# космос

# красные карлики

# экзопланеты

8 ноября, 18:29

Адель Романова

Астрономы вычислили, откуда на Землю прилетают межзвездные объекты

По расчетам, большинство «гостей» из других звездных систем летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.

Астрономия

# космос

# межзвездные объекты

# Солнечная система

9 ноября, 15:00

Анатолий Глянцев

Физики доказали, что Вселенная не может быть компьютерной симуляцией? Что здесь не так

Недавно интернет взорвался заголовками: «Симуляция Вселенной невозможна», «Новое исследование полностью опровергает теорию симуляции». Поводом стала статья, авторы которой вознамерились доказать, что мы не живем внутри компьютера. Naked Science объясняет, что не так с этой новостью и можно ли на самом деле доказать, что «матрицы не существует».

С точки зрения науки

Физика

# вселенная

# математика

# Матрица

# теория всего

# физика

Выбор редакции

12 ноября, 10:47

Максим Абдулаев

Бактерии со сломанными жгутиками поплыли вперед на собственных продуктах жизнедеятельности

Биология

# бактерии

# жгутики

# локомоция

# микробиология

25 октября, 10:40

Любовь С.

Недалеко от Солнечной системы нашли потенциально обитаемую суперземлю

Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.

Астрономия

# звезды

# зона обитаемости

# красный карлик

# спектрограф

# Суперземля

# телескопы

8 ноября, 18:29

Адель Романова

Астрономы вычислили, откуда на Землю прилетают межзвездные объекты

Астрономия

# космос

# межзвездные объекты

# Солнечная система

24 октября, 14:02

РТУ МИРЭА

Эксперт рассказал, какие приборы нельзя подключать к удлинителю и почему

В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.

РТУ МИРЭА

# безопасность

# бытовые приборы

# пожары

# удлинитель

# электричество

# электропроводка

[miniorange_social_login]

"Люди не только путают нейросетевую поэзию со стихами классиков, но и отдают ей предпочтение." А эти люди сейчас с нами в одной комнате? Да, иногда нейронка может выдать что-то интересное. Но так то ии текст зачастую довольно плоский и не несет в себе духовной ценности. Ого, представьте себе, произведения пишут не просто чтобы красиво словами пораскидываться. Нужно еще вложить что-то человеческое, высокое в слова, чтобы они стали поэзией.

Ответить

-1

Aziza Zhunusova

14.08.2025

О боже опять пишут что нейросеть это генератор токенов по вероятности. Это не так! Там есть преобразования в многомерных пространствах а не простое softmax определение вероятности. Изучить исходный код трансформера и вы поймете.

Ответить

Aziza Zhunusova

14.08.2025

Ответить

а.

15.08.2025

-1

Ответить

-1

Историк технологий объяснил, почему бесполезно спрашивать нейросети об их ошибках

По теме

Израильские ученые проверили нейросети на скрытый антисемитизм

Люди хуже отнеслись к коллегам, которые использовали ИИ для работы

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

Популярное

Комментарии

Последние новости:

Физики переписали правила для сингулярностей пространства-времени

На Марсе нашли восемь кандидатов в карстовые пещеры

Ученые предложили новую логистику торговли Сибири с Азией

«Гормон любви» и физическая близость в паре помогли ранам зажить быстрее

Зажечь Солнце на Земле: как Россия в одиночку строит свой ИТЭР – интервью с Андреем Аникеевым

Огонь спуска с орбиты: миф о трении и вопрос с плазмой

Физики доказали, что Вселенная не может быть компьютерной симуляцией? Что здесь не так

Атом через 100 лет: как ядерная энергия изменит будущее человечества

Последние комментарии

Самые обсуждаемые

Физики доказали, что Вселенная не может быть компьютерной симуляцией? Что здесь не так

Астрономы вычислили, откуда на Землю прилетают межзвездные объекты

Вселенная перешла к фазе замедленного расширения, а темная энергия ослабевает

Ученые увидели опасность для природы и людей в фейковых ИИ-видео с дикими животными