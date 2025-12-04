  • Добавить в закладки
4 декабря, 13:27
Редакция Naked Science
18

Нейросети пишут чересчур официально. Новая разработка «Яндекса» показывает, где именно

❋ 3.5

Исследователи «Яндекса» разработали новый метод оценки качества машинного перевода. На основе этой метрики разработчики смогут целенаправленно совершенствовать существующие модели. Разработку уже оценило мировое академическое сообщество: компания представила статью о методе на международной конференции по машинному обучению EMNLP 2025.

Технологии
# искусственный интеллект
# нейросети
# перевод
# речь
# языковые модели
Робот читает книгу / © ИИ-генерация, freepik

Сегодня многие нейросети уже довольно точно переводят тексты, но делают это не всегда естественно. В неформальном диалоге модель может перевести sorry, my bad как «приношу извинения, это моя вина» вместо «извини, ошиблась». Пользователь заметит, что нейросеть выбрала излишне официальный тон, но существующие системы оценки перевода такие ошибки игнорируют. Новый метод помогает обратить внимание на такие недочеты.

Новая система оценки «Яндекса» называется RATE (Refined Assessment for Translation Evaluation — улучшенная метрика для оценки перевода). Эксперты не используют ее напрямую для дообучения моделей перевода. Однако RATE позволяет с высокой точностью оценить, где именно современные модели ошибаются и что нужно улучшить, чтобы их переводы стали точнее и естественнее для пользователя. 

Разработка получила мировое признание в академическом сообществе: статью о RATE представили на международной конференции по машинному обучению EMNLP 2025. Среди других участников конференции — Microsoft Research, Google Research, OpenAI, Anthropic, Amazon, Baidu, Alibaba, Huawei, Samsung Research, NVIDIA Research, Intel Labs, IBM Research, Bloomberg, Adobe Research, Qualcomm Research.

В отличие от других метрик, RATE оценивает перевод по трем главным для пользователя критериям: точность передачи смысла, естественность языка и соответствие стилю оригинала. Это позволяет использовать метод для любых типов текстов. Инструмент помогает проверить в новостях точность передачи фактов, в постах соцсетей — выявить чрезмерную формальность фраз, а в художественных текстах — оценить стиль и плавность речи. RATE не только отмечает ошибку, но и оценивает ее значимость — от небольших неточностей до сильных искажений.

Руководитель команды оценки качества перевода в «Яндексе» Екатерина Еникеева рассказала, что исследователям во время работы с другими методами не хватало детализации. По ее словам, MQM (Multidimensional Quality Metrics — многомерные показатели качества) слишком сложный, а ESA (Error Span Annotation — аннотация диапазона ошибок) замечает только грубые ошибки

«Эти метрики помогают проверить точность, но не позволяют оценить, насколько перевод получается естественным. А именно это сегодня стало главным критерием для пользователя в восприятии перевода. RATE позволяет оценить и точность, и естественность перевода, дает более полную картину его качества и может подсказать разработчикам, как развивать модель для улучшения перевода», — пояснила Еникеева.

Сравнение на данных крупнейшего международного конкурса WMT показало, что RATE выявляет в семь раз больше ошибок, чем MQM и ESA. Результаты эксперимента оценивали высококвалифицированные ИИ-тренеры. Сравнение доказало, что другие метрики не смогли обнаружить множество недочетов в переводах нейросетей, которые заметили пользователи.

Эксперимент показал: современные модели машинного перевода достигли значительного прогресса в точности. При этом эталоном естественности и плавности речи по-прежнему остается человеческий перевод, хотя большая языковая модель «Яндекса» уже приблизилась к этому уровню, опередив такие модели, как Claude-3.5 и GPT-4.

«Яндекс» уже использует RATE для улучшения своих моделей, адаптируя их переводы под разные сценарии — от деловой переписки до неформального общения. RATE также помогает исследователям создавать новые алгоритмы, ориентированные на живую человеческую речь, а не только на формальные критерии.

Технологии
# искусственный интеллект
# нейросети
# перевод
# речь
# языковые модели
Комментарии

Написать комментарий

Последние новости:

  1. Ученые нашли следы древней изолированной ветви человечества в ЮАР

    4 декабря, 13:29

  2. Нейросети пишут чересчур официально. Новая разработка «Яндекса» показывает, где именно

    4 декабря, 13:27

  3. Земная жизнь стала сложной на миллиард лет раньше, чем считалось

    4 декабря, 12:33

  4. Огород в квартире: какие растения выбрать и как за ними ухаживать

    4 декабря, 12:16
Последние комментарии

Иван Колупаев
4 минуты назад
Александр, события с горизонтом в 20-30 лет очень легко прогнозировать - до срока еще не каждый доживет, а из тех кто сумеет мало кто вспомнит о

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Денис Прохоров
14 минут назад
а все, нашел

Отрастить неотращиваемое: как ученые из России хотят научить человеческий организм регенерировать подобно аксолотлю

Александр Березин
20 минут назад
Иван, "Александр, ни для той ни для другой ситуации носителей у России все равно нет" А выше я где-то сказал, что есть? Сказал я совсем другое:

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Денис Прохоров
21 минута назад
Не понял как добавить статью в закладки, чтобы потом прочитать

Отрастить неотращиваемое: как ученые из России хотят научить человеческий организм регенерировать подобно аксолотлю

Денис Прохоров
23 минуты назад
Ура патриоты видимо не поняли посыл статьи, а может и не читали ее до конца, чтобы понять насколько она ватная

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Денис Прохоров
24 минуты назад
Визионер... 6/10

Какой ядерный реактор строить: тест ваших предпочтений

Иван Колупаев
26 минут назад
Александр, ни для той ни для другой ситуации носителей у России все равно нет, так что сравнение одного нуля с другим не имеет особого смысла. Даже

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Иван Колупаев
31 минута назад
Александр, проблема связи в задержке которая для Марса составляет в среднем 11 минут (3 мин в самой благоприятной ситуации и 22 мин при наибольшем

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Anton Chashchin
32 минуты назад
Может это российские космонавты прибыли на мкс а с ними американец ? А не барин астронавт и с ним заодно 2 помощника из русских?

Впервые в истории восемь космических кораблей пристыкованы к МКС

Roman Markin
40 минут назад
Такая картина.

Какой ядерный реактор строить: тест ваших предпочтений

Александр Березин
51 минута назад
Alfa, "ПХАХАХХАХАХАХАХАХ Чем ты читало мой комментарий? Мы сейчас говорим о современной ситуации, мне совершенно нет дела до гнилых муслим и иудеев,

Спутники запечатлели, как исполинский «Куб» в Саудовской Аравии начинает расти из-под земли

Elusive Joe
1 час назад
Что мешает продать зеркала и заменить солнечными панелями, которые крутить за солнцем? Это позволит сохранить большую часть конструкций

Экономика против инноваций: названа причина закрытия крупнейшего солнечного теплового проекта США

Elusive Joe
1 час назад
Irik, фантазёр! Ты меня называла...

Экономика против инноваций: названа причина закрытия крупнейшего солнечного теплового проекта США

Elusive Joe
1 час назад
Ruslan, ааа! Так это потому что у них Собянина нет! Он спец по платным парковкам...

Впервые в истории восемь космических кораблей пристыкованы к МКС

Александр Березин
1 час назад
Сергей, то есть вы не читали объяснение Циолковского, который ответил на этот ваш вопрос сотню лет назад?

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Алексей Маа
1 час назад
5 тысяч в год . как то мало . в Китае машин собирают по 20 миллионов . а робот будет и дешевле и проще.

Видео, показывающее первые в мире массовые поставки человекоподобных роботов вызвало вопросы о его подлинности

Александр Березин
1 час назад
Иван, ""Технически" это как? Без необходимости доставить на Марс человека живым и не требуя возвращения обратно?" Нет, технически -- это значит

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Алексей Маа
1 час назад
Dimus, не стоит говорить за всех .

Видео, показывающее первые в мире массовые поставки человекоподобных роботов вызвало вопросы о его подлинности

Алексей Маа
1 час назад
Иван, животные убивают животных. Люди убивают людей . что то не заметно чтоб людей меньше становилось от убийств. Тоже рак или инфаркт убивает в

Видео, показывающее первые в мире массовые поставки человекоподобных роботов вызвало вопросы о его подлинности

Александр Березин
1 час назад
nemoXX, " Однако, версия рос. сми иная и выглядит правдоподобнее. Россия в рамках рос-китайской лунной программы поставит реактор для лунной базы."

В Институте космических исследований РАН предложили отказаться от полетов на Марс

Самые обсуждаемые

