16 сентября, 08:31

Полина Меньшова

Историк сформулировал принципы, которые защитят информацию от галлюцинаций нейросетей

❋ 5.2

Модели искусственного интеллекта нередко искажают факты, что ставит под угрозу не только интерпретацию известных научных данных, но и обработку новых и написание текстов на их основе. Историк из США проанализировал специфику информации о прошлом и опубликовал рекомендации по ее изложению, которые должны сформировать у текста «иммунитет» к галлюцинациям нейросетей.

Технологии

# архитектура нейросети

# искусственный интеллект

# история

# нейросети

Историк предложил писать тексты так, чтобы они компенсировали слабые стороны ИИ / © Автор неизвестен, msn.com

Главный принцип взаимодействия с искусственным интеллектом — помнить об ограничениях, обусловленных его устройством. Например, нейросетям не стоит задавать вопрос наподобие «В чем причина твоей ошибки?», поскольку они генерируют ответы, вычисляя, какой элемент (слово, предложение и так далее) с большей вероятностью будет следующим.

Историк Ян Бурцлафф из Корнеллского университета в США сформулировал правила, которые позволят защитить научные работы по истории от неверной интерпретации при использовании нейросетей. Его эссе опубликовал научный журнал Rethinking History.

По мнению Бурцлаффа, тексты о прошлом важно выстраивать так, чтобы сразу восполнять потери, которые могут возникнуть при анализе с помощью искусственного интеллекта.

1. Интерпретация важнее описания. Нейросети прекрасно пересказывают факты, но не способны проанализировать их, исходя из контекста. Следовательно, задача историка — подчеркивать значимость тех или иных данных, объясняя, под каким углом на них необходимо смотреть: «Интерпретация — это не комментарий после факта. Это формирование смысла в момент каждой встречи с нестабильностью. Это разница между перечислением произошедшего и вопросом, что это значило, для кого и когда, в конкретных контекстах».

Бурцлафф привел в пример историю человека, прошедшего через несколько концлагерей: «Я не стонал, ни разу [после 25 ударов плетью]. Даже немецкий офицер после этого меня похвалил на немецком». По словам автора эссе, пересказ этого эпизода от ChatGPT был связным и структурированным, содержал информацию о месте действия, основных событиях и некоторых эмоциях, например страхе. Тем не менее языковая модель не передала противоречивости описанной сцены — «психического напряжения, необходимого, чтобы оставаться молчаливым под кнутом, или двусмысленности получения похвалы за это».

2. Создавать, а не воспроизводить. Не любое историческое свидетельство вписывается в сюжетные шаблоны. Когда ИИ преобразует истории в набор категорий вроде «детство в укрытии», «материнская жертва» и «травма военного времени», зачастую утрачивается множество важных деталей.

В связи с этим Бурцлафф предложил историкам заострять внимание на значимых подробностях частного опыта: «Историк никогда не будет просто обработчиком архивов, а будет посредником и переводчиком. Не аналитиком данных, а рисковым искателем. Это также отличает нас от специалистов в области социальных наук: мы не начинаем с фиксированных категорий и не сортируем доказательства с опорой на них. Мы начинаем с частного, ситуативного, нестабильного — и выявляем смыслы, которые появляются, когда уделяется внимание контексту».

3. Учитывать масштаб, но не подчиняться ему. Языковые модели помогают анализировать огромные массивы данных: выявляют закономерности, вычисляют их частотность. Однако вместе с тем неизбежно теряется информация о редких, нерядовых явлениях.

«Генеративный искусственный интеллект упускает странные, сюрреалистичные моменты, которые разрушают логику свидетельства — моменты, которые нельзя абстрагировать без потерь. А ведь именно они составляют суть работы историка: он не подтверждает доминирующие темы в наборе данных, а замечает шум, интерпретирует то, что не вписывается в классификацию», — пояснил Бурцлафф.

4. Не сглаживать углы. Алгоритмы нейросети контролируют этичность ответов, которые она генерирует. Из-за этого могут пропадать сведения, важные для контекста, например описания жестокости, характерные для историй о Холокосте и Второй мировой войне, которые анализировал Бурцлафф.

Одна из женщин, прошедших концлагерь, рассказывала, что всегда стояла в «правильной» очереди, имея в виду, что эта очередь не вела к смерти: «Три раза Менгеле выбирал меня, меня не отправляли в газовые камеры, я была счастлива. Он всегда шел с палкой, показывая направо и налево. Мы не знали, какая очередь хорошая, но я всегда оказывалась в правильной». В ИИ-пересказе этой истории выживание превратилось в «стойкость», побои — в «преследование», удача — в «обстоятельства». Это корректно с фактической точки зрения, однако не отражает сути происходящего, искажая суть исторического свидетельства.

Ян Бурцлафф призвал отказаться от алгоритмов, которые «делают текст этичным»: «Отказ от алгоритмической этики — не отрицание морали. Это настоятельное требование, чтобы моральный суд в истории был не вычислимым, а ситуативным, реляционным и прежде всего незавершенным».

5. Писать живо. Важно не только акцентировать внимание на эмоциональной составляющей событий и их контексте, но и учитывать стилистические особенности исторических свидетельств.

«Машины могут предсказать предложение, но не могут задержаться в нем. Они не могут задуматься, стоит ли продолжать. Стили, которые используют люди, — осадочное знание, сформированное национальными школами, региональными особенностями и интеллектуальными традициями. В этом смысле стиль — это не академическое излишество, а этическая форма. Предложение, которое останавливается, которое поворачивается, которое сопротивляется завершению — вот где начинается историография. Между памятью и смыслом, грамматикой и разрывом», — подытожил Ян Бурцлафф.

Несмотря на то что рекомендации ученого касаются прежде всего истории и исторических свидетельств, они могут быть релевантны для других научных областей, а также для других типов текстовой информации. Умение выявлять ключевые детали и учитывать их в анализе всего массива данных позволит компенсировать «слабости» языковых моделей и защитить значимые сведения от нейросетевого искажения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.

Технологии

# архитектура нейросети

# искусственный интеллект

# история

# нейросети

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Кошкообразные хищники: эволюция ловких охотников и не только

Центр «Архэ»

Москва

Лекция

28 Окт

700 ₽

Как устроено чувство вкуса

Центр «Архэ»

Онлайн

Лекция

28 Окт

600 ₽

Биохимия лишайников и применение человеком

Центр «Архэ»

Санкт-Петербург

Лекция

28 Окт

750 ₽

Монгольское нашествие и установление власти Орды над Русью

Центр «Архэ»

Онлайн

Лекция

29 Окт

700 ₽

Происхождение языка: от бактерии до Пушкина

ВСмысле

Санкт-Петербург

Лекция

29 Окт

Бесплатно

Занимательная вероятность

ВДНХ

Москва

Лекция

29 Окт

900 ₽

Майя в начале I тыс. н.э.: генезис государства и классического общества

Центр «Архэ»

Москва

Лекция

29 Окт

750 ₽

Экстремальные объекты Вселенной

Санкт-Петербургский Планетарий

Санкт-Петербург

Лекция

29 Окт

700 ₽

Крик корня мандрагоры: как услышать и не умереть?

Центр «Архэ»

Санкт-Петербург

Популярное

За сутки

За неделю

За месяц

25 октября, 10:40

Любовь С.

Недалеко от Солнечной системы нашли потенциально обитаемую суперземлю

Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.

Астрономия

# звезды

# зона обитаемости

# красный карлик

# спектрограф

# Суперземля

# телескопы

27 октября, 10:38

Игорь Байдов

Эксперимент с амадинами помог объяснить феномен рассветного пения птиц

Ежедневно, еще до восхода солнца, миллионы птиц по всей планете наполняют воздух своими голосами. Этот рассветный концерт — одно из самых красивых и загадочных явлений природы. Почему пернатые певцы предпочитают встречать день именно так? Авторы нового исследования предложили простой ответ: птицы не могут иначе. Ночь заставляет их молчать, а утро дает долгожданную свободу, выплескивающуюся в бурном и страстном хоре.

Биология

# вокализация

# животные

# пение птиц

# птицы

27 октября, 11:44

Илья Гриднев

Ученые разобрались, как астрономы майя веками предсказывали солнечные затмения

Исследователи объяснили, как цивилизация майя добивалась высокой точности в предсказании солнечных затмений на протяжении столетий. Для коррекции накапливающихся астрономических неточностей они использовали сложную систему пересекающихся календарных таблиц.

Антропология

# Календарь Майя

# солнечное затмение

# цивилизация майя

25 октября, 10:40

Любовь С.

Недалеко от Солнечной системы нашли потенциально обитаемую суперземлю

Астрономия

# звезды

# зона обитаемости

# красный карлик

# спектрограф

# Суперземля

# телескопы

24 октября, 14:02

РТУ МИРЭА

Эксперт рассказал, какие приборы нельзя подключать к удлинителю и почему

В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.

РТУ МИРЭА

# безопасность

# бытовые приборы

# пожары

# удлинитель

# электричество

# электропроводка

24 октября, 17:39

ФизТех

Ученые создали инструмент, с помощью которого нейросети смогут эффективнее избегать нежелательных тем

Команда исследователей из Т-Технологий и МФТИ разработала метод, позволяющий построить детальную «карту» эволюции абстрактных понятий в глубине больших языковых моделей. Этот подход, основанный на «графах потоков признаков», не только открывает «черный ящик» ИИ, делая его работу прозрачной, но и дает в руки ученых мощный инструмент для точного управления поведением нейросетей, например, для подавления нежелательных тем в генерируемом тексте.

ФизТех

# алгоритмы

# большие языковые модели

# искусственный интеллект

# нейросети

# языковые модели

13 октября, 11:10

Илья Гриднев

Движение жидкости в мозге предложили считать основой сознания

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

Биология

# мозг

# сознание

# электромагнитное поле

24 октября, 14:02

РТУ МИРЭА