22.07.2025, 14:44

ФизТех

71,7 тыс

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

❋ 5.1

Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.

ФизТех

# ChatGPT

# нейросети

# ошибки

# слова

# текст

В МФТИ выявили признаки сгенерированных нейросетью текстов / © Alena Plotnikova, unsplash.com

Работа принята на конференцию Findings of ACL 2025 и опубликована в виде препринта на портале arXiv. Стремительное развитие больших языковых моделей (LLM), таких как ChatGPT, Gemma и LLaMA, привело к тому, что сгенерированные ими тексты наполнили интернет, учебники, учебные пособия и даже научные статьи. Возникла острая проблема: как отличить оригинальное человеческое творчество от продукта машины? Существующие системы детекции сгенерированного текста часто работают как «черные ящики»: они выдают вердикт «человек» или «ИИ», но не могут объяснить, на каких конкретно свойствах текста основано их решение. Такая непрозрачность ограничивает их гибкость и надежность: если детектор ошибается, то бывает очень сложно понять, почему именно он ошибся и как избежать такой ошибки в будущем.

Исследователи решили подойти к проблеме с другой стороны. Вместо того чтобы создавать еще один «черный ящик», они задались целью заглянуть «под капот» нейросети и превратить ее внутренние состояния в набор четких и интерпретируемых характеристик текста. Для этого они использовали известную технику — разреженные автокодировщики (Sparse Autoencoders, SAE). Если представить внутреннее состояние нейросети как сложный коктейль из тысяч смешанных сигналов, то SAE работает как высокоточный сепаратор, который раскладывает этот коктейль на более чистые, атомарные «ингредиенты», которые легче интерпретировать. Каждый такой признак отвечает за определенный аспект текста: например, за сложность предложений или использование специфической лексики.

Лаида Кушнарева, старший академический консультант в компании Huawei, прокомментировала: «Люди, регулярно имеющие дело с текстами, сгенерированными ChatGPT, зачастую могут распознать такой текст по характерным чертам — например, неуместно сухому и формальному языку, чрезмерно длинным и “водянистым” вступлениям перед переходом к сути, повторяющимся формулировкам одной и той же мысли и низкой информационной плотности в целом. Однако большинство популярных детекторов сгенерированных текстов не показывают, в какой степени в тексте присутствуют эти и другие понятные человеку особенности.

В отличие от них, наш детектор на основе SAE позволяет автоматически раскладывать тексты на “атомарные” числовые признаки, многие из которых поддаются интерпретации в терминах, понятных человеку. При этом детектор обходит все существующие решения на том наборе данных, который мы использовали. Кроме того, мы показали, что с помощью SAE можно обнаруживать и некоторые осознанные попытки скрыть факт генерации текста — например, преднамеренное добавление лишних пробелов, артиклей или нестандартных символов с целью запутать детекторы. Другими словами, данная техника позволяет автоматически разобрать текст “по косточкам” и принять решение, обоснованность которого может быть впоследствии проверена человеком на основе выявленных признаков и их интерпретации».

В ходе исследования ученые подавали на вход нейросети Gemma-2-2B различные примеры текстов и сохраняли внутренние состояния с глубоких слоев модели для каждого текста. Далее, они выделили из этих внутренних состояний тысячи “атомарных” признаков с помощью SAE. Используя эти признаки, они обучили классификатор для распознавания сгенерированных текстов и приступили к самой интересной части — интерпретации. Они выявили как «универсальные» признаки, характерные для многих генерирующих моделей, так и специфические, присущие отдельным семействам ИИ или определенным типам текста (например, научным статьям и отзывам). Так, в текстах на научные темы ИИ склонен к излишне сложным синтаксическим конструкциям, а в текстах на финансовую тематику — к необоснованным, многословным рассуждениям о простых фактах.

Интерпретации одного из самых «универсальных» признаков 3608, полезных для детектирования AI-текстов / ©
Kuznetsov, K. et al., ArXiv.org

Например, в работе показано, что «признак №3608 с 16-го слоя SAE» отвечает за синтаксическую сложность. Ученые обнаружили, что искусственное усиление этого признака в процессе генерации текста заставляет нейросеть создавать чрезмерно запутанные предложения, которые сложно читать. Наоборот, ослабление этого признака приводит к появлению коротких, «рубленых» фраз с минимальной связностью. Другой сильный признак, №4645, отвечает за степень уверенности текста, а №6587 — за многословные вступления и чрезмерно подробные объяснения.

Анастасия Вознюк, студентка МФТИ, добавила: «Помимо анализа того, на что конкретно модель обращает внимание при детекции, мы попробовали управлять моделью генерации. Признаки, которые мы определили ранее, можно усиливать или ослаблять, и в результате наблюдать что в некоторых случаях новый сгенерированный текст сильнее или, наоборот, слабее, характеризуется данным признаком. Например, при изменении признака определяющего уровень «академичности» языка текста, будет изменяться в соответствующую сторону и стилистика текста.

Результаты показывают, что если давать современным языковым моделям вроде ChatGPT стандартные запросы для генерации, то они с большой вероятностью генерируют текст с характерными чертами, который легко обнаруживается этим и другими детекторами. Однако исследователи предупреждают: если дать нейросети более персонализированное задание (например, попросить написать текст в каком-то необычном для нее стиле), эти характерные черты могут ослабнуть или даже исчезнуть, что может сделать задачу детекции значительно сложнее.

В исследовании был применен новый многогранный подход, который сочетает автоматическое выделение признаков, их ручную интерпретацию и экспериментальную проверку с помощью техники «управления» (steering). Это создает основу для разработки более интерпретируемых детекторов, которые смогут не просто выносить вердикт, но и предоставлять отчет о том, какие именно аномалии были найдены в тексте. Такие инструменты будут полезны для преподавателей, редакторов и исследователей дезинформации. В более широкой перспективе эта работа является важным шагом к демистификации искусственного интеллекта, позволяя нам лучше понимать, как нейросети «мыслят» и создают тексты.

Дальнейшие исследования будут направлены на применение этого метода к новым, более мощным языковым моделям и на изучение более сложных и трудноуловимых признаков, чтобы оставаться на шаг впереди тех, кто пытается использовать ИИ в недобросовестных целях, и при этом уменьшить вероятность ошибиться и несправедливо обвинить человека в том, что его текст был сгенерирован.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.

ФизТех

# ChatGPT

# нейросети

# ошибки

# слова

# текст

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Человеческое в технике

Политехнический музей

Москва

Лекция

19 Июл

500 ₽

Немыслимо: о возможностях и ограничениях нашего мышления

ВСмысле

Онлайн

Лекция

20 Июл

Бесплатно

Как кишечник управляет мозгом: еда, микробиота и ось кишечник-мозг

Курилка Гутенберга

Москва

Лекция

20 Июл

Бесплатно

Тайны Северной Двины: как Россия нашла своих звероящеров

Центр «Архэ»

Онлайн

Лекция

20 Июл

Бесплатно

Большие перелеты советской страны. «Пролетарий» летит над Европой

Астрокомплекс им. С.П. Королева

Москва

Лекция

21 Июл

Бесплатно

Жемчужины южного неба. Астрономия в Чили

Астрокомплекс им. С.П. Королева

Москва

Лекция

21 Июл

1500 ₽

Глаза — инструкция по применению

ВСмысле

Санкт-Петербург

Лекция

22 Июл

Бесплатно

Модные слова в жизни, в литературе, в прессе

ВДНХ

Москва

Лекция

22 Июл

Бесплатно

Дизайн на орбите: как покорение космоса перекроило моду и быт

Политехнический музей

Москва

Популярное

За сутки

За неделю

За месяц

17 июля, 10:00

Губкинский университет

Российское масло уменьшило расход топлива и увеличило ресурс газопоршневых двигателей

Ученые РГУ нефти и газа (НИУ) имени И. М. Губкина разработали синтетическое масло для газопоршневых двигателей, позволяющее снизить расход топливного метана на семь процентов. Продукт разработан в целях импортозамещения в сфере энергетики. Разработка открывает новые возможности распределенной энергетики на Крайнем Севере, Дальнем Востоке и других территориях без центральных сетей.

Губкинский университет

# двигатели

# материалы

# моторное масло

# промышленность

18 июля, 09:30

Марк Чернов

Ученые выяснили, почему шимпанзе обожают собирать и прятать кристаллы

Археологи часто находят красивые прозрачные кристаллы на стоянках древних людей, живших почти 800 тысяч лет назад. Самое странное, что наши предки не делали из них наконечники для стрел или бусы, а, похоже, просто повсюду носили с собой и бережно складывали в кучи. Испанские ученые нашли объяснение этой странной привычке, понаблюдав за ближайшими родственниками человека — шимпанзе.

Антропология

# антропология

# палеоантропология

# поведение животных

# эволюция человека

17 июля, 15:20

ФизТех

Астрофизики установили причины ритмичных вспышек блазара Тон 599

Большой коллектив ученых из Специальной астрофизической обсерватории РАН (п. Нижний Архыз), Астрокосмического центра ФИАН, Крымской астрофизической обсерватории РАН, Санкт-Петербургского государственного университета и МФТИ с коллегами впервые провел комплексный многоволновой анализ переменности блазара Тон 599 за период с 1983 по 2025 год и обнаружил в этих данных скрытый ритм, указывающий на работу двух взаимосвязанных механизмов.

ФизТех

# астрономия

# астрофизика

# блазары

# Черные дыры

17 июля, 10:00

Губкинский университет

Российское масло уменьшило расход топлива и увеличило ресурс газопоршневых двигателей

Губкинский университет

# двигатели

# материалы

# моторное масло

# промышленность

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Кит живет двести лет, умеет пробивать головой полуметровый лед и поет океанский джаз голосом несмазанной дверной петли. Охотоморские гренландские киты — это не просто многотонные ледоколы. Это древние узники, которые остались жить в Охотском море со времен последнего оледенения. Это счастливцы, которые смогли пережить гарпуны китобоев XIX-XX веков, но сегодня уязвимы не меньше. Чтобы спасти этих поразительных китов, российским ученым и команде фонда «Природа и люди» приходится: считать хвосты, читать биографии по шрамам, прятать подростков от хищников, стрелять (спутниковыми метками) с парамоторов и тяжелых дронов. Рассказываем, как устроена жизнь гренландских китов России и кто помогает им не исчезнуть навсегда с лица планеты.

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

16 июля, 15:12

Evgenia Vavilova

Физики впервые воспроизвели в лаборатории процесс извлечения энергии из черной дыры

Процессы, сопровождающие жизнь черных дыр, интересуют не только теоретиков. Ученые уже знают, что энергия и частицы могут покидать черные дыры и теперь работают над способами эту энергию использовать.

Физика

# Роджер Пенроуз

# Черные дыры

# электромагнитные волны

# энергия

25 июня, 16:20

Любовь С.

Физики уточнили возможные размеры Вселенной

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

Астрономия

# бесконечность

# вселенная

# геометрия

# пространство

# реликтовое излучение

# свет

# топология

25 июня, 15:09

Марк Чернов

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

Физика

# вода

# Молекулярная биология

# структура воды

# фазовые переходы

9 июля, 13:06

Редакция Naked Science

YouTube в России вырос даже с ограничениями, в отличие от «VK Видео»

Видеосервисы стали неотъемлемой частью жизни россиян. В 2026 году охваты большинства платформ продолжают расти, в том числе YouTube.

Медиа

# «ВКонтакте»

# YouTube

# аудитория

# блокировки

# видеосервис

# интернет

# медиа

[miniorange_social_login]

Я был бы рад, если бы появилось средство, с очень высокой вероятностью определяющее тексты от ИИ. Но откровенно говоря, не думаю, что можно сделать подобное на длинный период времени. Создатели моделей, которые не хотят, чтобы их детяще подсвечивали, просто уберут или сильно замаскируют те места, по которым их научились распознавать. В этом смысле создатели подобных распознавателей ИИ как раз всегда будут не на шаг впереди, а на два на шага позади создателей самих генераторов текста, изображений и т.д.

Ответить

Алексей Остолецкий

27.07.2025

А самое главное, это размер детектора < 1 кБт "if any Text then AI" - никогда не прогадает. А если чел будет писать на камеру и детектор всё равно скажет ИИ, то такая отмазка - чел нахватался от ИИ паттернов, вот и выдал это на тесте.

Ответить

Наталья

25.07.2025

Это замечательно. Я часто пишу стихи и книги. И мне говорят многие, что это компьютерная обработка. Очень здорово, что появилась такое достижение науки. Я счастлива. 😊👍

Ответить

Andrey E

24.07.2025

Элементарно Ватсон🤷‍♂️

Ответить

Arthur Kusainov

24.07.2025

Эта статья тоже с помощью ИИ написана 😂😂😂

Ответить

—

Andrey E

24.07.2025

Arthur, 👌

Ответить

vitautas shilingas

24.07.2025

Статья безупречна – и этим сразу настораживает. Неужели учёные тоже ИИ?! Шучу. Но теперь каждое “спасибо” коллеге буду читать вслух, ища признаки “нейросетевой сухости”. Сомнения – наш новый digital-иммунитет!»

Ответить

Гриня Медведков

23.07.2025

Действительно, очень "простой" способ. Всего-то нужна отдельная закрытая модель ФизТеха, да ещё и натасканная на английский язык – очень полезно. Кликбейт как он есть – спасибо, что не от редакции.

Ответить

Иван Колупаев

23.07.2025

Ну прям какие-то пчелы против меда. Студенты против сгенеренных ИИ курсовых 😁

Ответить

—

Chelovek kk

24.07.2025

Иван, лол, и с чего ты взял, что они учатся только через списывание?

Ответить

Еще 2 ответа

Иван Колупаев

24.07.2025

Chelovek, с чего ты взял что мне интересно твое мнение?

Ответить

—

Chelovek kk

29.07.2025

Иван, не, а если серьезно, другой ответ будет? Просто я не вижу логики в твоем суждении. Типо, у нас есть интернет, а в нем статьи, образовательные материалы и решенные домашки, но это не значит, что поголовно все долбаны и используют это только для списывания, а не для развития. С книгами и иишками то же самое, это всё тупо носители информации (только в случае ии, этот носитель с тобой говорить может), а как их использовать - дело лично каждого, и я тупо не вижу смысла, когда одних превозносят над другими. Если кто-то списывает, не значит, что все так делают. У языковых иишек огромный потенциал в сфере помощи в личном развитии

Ответить

Гриня Медведков

23.07.2025

Ответить

Иван Колупаев

23.07.2025

Ну прям какие-то пчелы против меда. Студенты против сгенеренных ИИ курсовых 😁

Ответить

—

Chelovek kk

24.07.2025

Иван, лол, и с чего ты взял, что они учатся только через списывание?

Ответить

Еще 2 ответа

Иван Колупаев

24.07.2025

Chelovek, с чего ты взял что мне интересно твое мнение?

Ответить

—

Chelovek kk

29.07.2025

Ответить

Arthur Kusainov

24.07.2025

Эта статья тоже с помощью ИИ написана 😂😂😂

Ответить

—

Andrey E

24.07.2025

Arthur, 👌

Ответить

Алексей Жажин

27.07.2025

Ответить

Алексей Остолецкий

27.07.2025

Ответить

Наталья

25.07.2025

Ответить

Andrey E

24.07.2025

Элементарно Ватсон🤷‍♂️

Ответить

vitautas shilingas

24.07.2025

Ответить

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

По теме

Израильские ученые проверили нейросети на скрытый антисемитизм

Сергей Марков: сценарий «Терминатора» не грозит нам ни в близком, ни в далеком будущем

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

Популярное

Российское масло уменьшило расход топлива и увеличило ресурс газопоршневых двигателей

Ученые выяснили, почему шимпанзе обожают собирать и прятать кристаллы

Астрофизики установили причины ритмичных вспышек блазара Тон 599

Российское масло уменьшило расход топлива и увеличило ресурс газопоршневых двигателей

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Физики впервые воспроизвели в лаборатории процесс извлечения энергии из черной дыры

Физики уточнили возможные размеры Вселенной

Физики подтвердили гипотезу о существовании двух жидких состояний воды

YouTube в России вырос даже с ограничениями, в отличие от «VK Видео»

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Путешествие к центру Земли: как «Психея» найдет прошлое нашей планеты в глубинах космоса

Миллионер из хрущоб: почему наши люди боятся открыть свой бизнес

Вакуум на службе транспорта: от пневмопочты до Hyperloop

Дайджест Naked Science

Кому откусит голову Дракон?

Орудия труда, свиньи и люди: где граница разумного

Борьба с ДДТ: крестовый поход против детей?

Пять правдивых теорий заговора

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

По теме

Израильские ученые проверили нейросети на скрытый антисемитизм

Сергей Марков: сценарий «Терминатора» не грозит нам ни в близком, ни в далеком будущем

Тяга ИИ к гонке вооружений и ядерным ударам сделала его опасным помощником в военно-политических вопросах

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?