• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
16 сентября, 08:31
Полина Меньшова
269

Историк сформулировал принципы, которые защитят информацию от галлюцинаций нейросетей

❋ 5.2

Модели искусственного интеллекта нередко искажают факты, что ставит под угрозу не только интерпретацию известных научных данных, но и обработку новых и написание текстов на их основе. Историк из США проанализировал специфику информации о прошлом и опубликовал рекомендации по ее изложению, которые должны сформировать у текста «иммунитет» к галлюцинациям нейросетей.

Историк предложил писать тексты так, чтобы они компенсировали слабые стороны ИИ
Историк предложил писать тексты так, чтобы они компенсировали слабые стороны ИИ / © Автор неизвестен, msn.com

Главный принцип взаимодействия с искусственным интеллектом — помнить об ограничениях, обусловленных его устройством. Например, нейросетям не стоит задавать вопрос наподобие «В чем причина твоей ошибки?», поскольку они генерируют ответы, вычисляя, какой элемент (слово, предложение и так далее) с большей вероятностью будет следующим.

Историк Ян Бурцлафф из Корнелльского университета в США сформулировал правила, которые позволят защитить научные работы по истории от неверной интерпретации при использовании нейросетей. Его эссе опубликовал научный журнал Rethinking History.

По мнению Бурцлаффа, тексты о прошлом важно выстраивать так, чтобы сразу восполнять потери, которые могут возникнуть при анализе с помощью искусственного интеллекта.

1. Интерпретация важнее описания. Нейросети прекрасно пересказывают факты, но не способны проанализировать их, исходя из контекста. Следовательно, задача историка — подчеркивать значимость тех или иных данных, объясняя, под каким углом на них необходимо смотреть: «Интерпретация — это не комментарий после факта. Это формирование смысла в момент каждой встречи с нестабильностью. Это разница между перечислением произошедшего и вопросом, что это значило, для кого и когда, в конкретных контекстах».

Бурцлафф привел в пример историю человека, прошедшего через несколько концлагерей: «Я не стонал, ни разу [после 25 ударов плетью]. Даже немецкий офицер после этого меня похвалил на немецком». По словам автора эссе, пересказ этого эпизода от ChatGPT был связным и структурированным, содержал информацию о месте действия, основных событиях и некоторых эмоциях, например страхе. Тем не менее языковая модель не передала противоречивости описанной сцены — «психического напряжения, необходимого, чтобы оставаться молчаливым под кнутом, или двусмысленности получения похвалы за это».

2. Создавать, а не воспроизводить. Не любое историческое свидетельство вписывается в сюжетные шаблоны. Когда ИИ преобразует истории в набор категорий вроде «детство в укрытии», «материнская жертва» и «травма военного времени», зачастую утрачивается множество важных деталей.

В связи с этим Бурцлафф предложил историкам заострять внимание на значимых подробностях частного опыта: «Историк никогда не будет просто обработчиком архивов, а будет посредником и переводчиком. Не аналитиком данных, а рисковым искателем. Это также отличает нас от специалистов в области социальных наук: мы не начинаем с фиксированных категорий и не сортируем доказательства с опорой на них. Мы начинаем с частного, ситуативного, нестабильного — и выявляем смыслы, которые появляются, когда уделяется внимание контексту».

3. Учитывать масштаб, но не подчиняться ему. Языковые модели помогают анализировать огромные массивы данных: выявляют закономерности, вычисляют их частотность. Однако вместе с тем неизбежно теряется информация о редких, нерядовых явлениях.

«Генеративный искусственный интеллект упускает странные, сюрреалистичные моменты, которые разрушают логику свидетельства — моменты, которые нельзя абстрагировать без потерь. А ведь именно они составляют суть работы историка: он не подтверждает доминирующие темы в наборе данных, а замечает шум, интерпретирует то, что не вписывается в классификацию», — пояснил Бурцлафф.

4. Не сглаживать углы. Алгоритмы нейросети контролируют этичность ответов, которые она генерирует. Из-за этого могут пропадать сведения, важные для контекста, например описания жестокости, характерные для историй о Холокосте и Второй мировой войне, которые анализировал Бурцлафф.

Одна из женщин, прошедших концлагерь, рассказывала, что всегда стояла в «правильной» очереди, имея в виду, что эта очередь не вела к смерти: «Три раза Менгеле выбирал меня, меня не отправляли в газовые камеры, я была счастлива. Он всегда шел с палкой, показывая направо и налево. Мы не знали, какая очередь хорошая, но я всегда оказывалась в правильной». В ИИ-пересказе этой истории выживание превратилось в «стойкость», побои — в «преследование», удача — в «обстоятельства». Это корректно с фактической точки зрения, однако не отражает сути происходящего, искажая суть исторического свидетельства.

Ян Бурцлафф призвал отказаться от алгоритмов, которые «делают текст этичным»: «Отказ от алгоритмической этики — не отрицание морали. Это настоятельное требование, чтобы моральный суд в истории был не вычислимым, а ситуативным, реляционным и прежде всего незавершенным».

5. Писать живо. Важно не только акцентировать внимание на эмоциональной составляющей событий и их контексте, но и учитывать стилистические особенности исторических свидетельств.

«Машины могут предсказать предложение, но не могут задержаться в нем. Они не могут задуматься, стоит ли продолжать. Стили, которые используют люди, — осадочное знание, сформированное национальными школами, региональными особенностями и интеллектуальными традициями. В этом смысле стиль — это не академическое излишество, а этическая форма. Предложение, которое останавливается, которое поворачивается, которое сопротивляется завершению — вот где начинается историография. Между памятью и смыслом, грамматикой и разрывом», — подытожил Ян Бурцлафф.

Несмотря на то что рекомендации ученого касаются прежде всего истории и исторических свидетельств, они могут быть релевантны для других научных областей, а также для других типов текстовой информации. Умение выявлять ключевые детали и учитывать их в анализе всего массива данных позволит компенсировать «слабости» языковых моделей и защитить значимые сведения от нейросетевого искажения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
15 сентября, 10:36
Игорь Байдов

Самая большая планета в Солнечной системе, всегда поражавшая воображение своими колоссальными размерами, немного сдала позиции. Новые высокоточные измерения орбитального зонда NASA показали, что Юпитер не такой большой и круглый, как считали астрономы последние 40 лет.

15 сентября, 11:30
РНФ

Ученые обнаружили, что общепринятые константы, с помощью которых химики предсказывают свойства молекул, содержали ошибки. Исправленные значения констант теперь объясняют ранее непонятные химические аномалии и позволяют предсказывать свойства новых материалов для квантовых технологий, датчиков и умных покрытий.

15 сентября, 15:23
Адель Романова

Как выяснилось, удар по летящему к Земле крупному небесному телу еще не гарантирует предотвращения катастрофы даже в случае его успешного отклонения. Есть множество вариантов, при которых астероид или комета может снова выйти на траекторию столкновения с нашей планетой.

12 сентября, 14:03
ТюмГУ

Исследования самодержавия могут пролить свет на феномен, исконно свойственный российской государственности, а значит, переосмыслить исторический путь России и выработку новых направлений развития, к такому выводу пришел ученый ТюмГУ.

15 сентября, 10:36
Игорь Байдов

Самая большая планета в Солнечной системе, всегда поражавшая воображение своими колоссальными размерами, немного сдала позиции. Новые высокоточные измерения орбитального зонда NASA показали, что Юпитер не такой большой и круглый, как считали астрономы последние 40 лет.

12 сентября, 12:14
Росатом

Ученые «Росатома» впервые в мире создали технологию, позволяющую извлекать сразу несколько платиновых металлов из растворов, образующихся при переработке отработавшего ядерного топлива: рутений, радий и палладий. Ранее такой технологии не существовало.

12 сентября, 14:03
ТюмГУ

Исследования самодержавия могут пролить свет на феномен, исконно свойственный российской государственности, а значит, переосмыслить исторический путь России и выработку новых направлений развития, к такому выводу пришел ученый ТюмГУ.

9 сентября, 11:03
Адель Романова

Третий известный межзвездный объект 3I/ATLAS летит примерно вдвое быстрее обоих своих предшественников. По расчетам, его вряд ли могло выбросить из родной планетной системы с подобной скоростью, и так разогнаться по пути он тоже не мог.

11 сентября, 12:04
ПНИПУ

Все больше покупателей начинают отказываться от привычки делать покупки на маркетплейсах, а число новых продавцов на площадках практически не увеличилось. Аналитика показывает, что за первый квартал 2025 года — прирост селлеров составил всего 0,45% по сравнению с аналогичным периодом прошлого года. В то же время, маркетплейсы активно расширяют сеть пунктов выдачи, особенно в регионах, где физическое присутствие всех брендов невозможно. Ученые Пермского Политеха рассказали, почему люди стали реже совершать покупки на маркетплейсах.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно