09.09.2025, 16:54

Редакция Naked Science

2,2 тыс

Исследователи «Яндекса» представили способ повысить качество работы рекомендательных систем

❋ 4.7

Исследователи рекомендательных технологий «Яндекса» нашли способ, как повысить качество работы рекомендательных систем, чтобы они лучше понимали предпочтения пользователей, например, в товарах или контенте, и составляли более точные рекомендации. Для этого исследователи внедрили дополнительную корректировку в процесс обучения таких моделей.

Технологии

# машинное обучение

# программное обеспечение

# Яндекс

Рекомендательные системы сегодня массовы, а их обучение превратилось в весьма ресурсоемкий процесс. Можно ли его облегчить? / © Вастрик, vas3k.blog

Внутреннее тестирование «Яндекса» показало, что новый подход позволяет повысить точность рекомендаций моделей в среднем на семь процентов по показателям качества ранжирования. «Яндекс» планирует использовать метод при обучении рекомендательных моделей собственных сервисов, в частности «Маркета». Метод будет полезен и другим компаниям, а также независимым разработчикам, работающим с рекомендательными системами в любой сфере — будь то соцсеть, интернет-магазин или стриминговый сервис.

О новом методе исследователи «Яндекса» рассказали в научной статье, которая была принята на ACM RecSys 2025. Это главная ежегодная международная конференция по рекомендательным системам, которая в этом году пройдет в девятнадцатый раз в Чехии. На конференцию также приняты работы крупнейших мировых технологических компаний — Amazon, Google и других.

Неточности при обучении рекомендательных систем

Рекомендательные системы обычно работают с миллионами объектов — текстами, аудио, видео, товарами. Это требует больших вычислительных ресурсов. Но сначала модель нужно обучить также на миллионах примеров, и для этого тоже необходимо много ресурсов. Чтобы сделать этот процесс менее ресурсоемким, во всем мире используют разные методы, которые заменяют сложные расчеты на более простые. Один из таких методов — sampled softmax, или алгоритм выборочного сэмплирования.

Его суть в том, что систему обучают различать предпочтения людей путем сравнения реализованных действий, которые пользователи совершили по отношению к конкретному объекту (положительные примеры), с нереализованными действиями, которых они не совершали относительно того же объекта (отрицательные примеры). В качестве объекта, например, может выступать определенный товар, тогда положительный пример — это добавление в корзину, а отрицательный — просмотр на сайте без добавления.

Обучение системы строится на том, что ей показывают положительный пример и отрицательные, — и благодаря этому модель начинает отличать одно от другого. Но можно показать ей миллионы отрицательных примеров из обучающего каталога, а можно лишь несколько случайно выбранных — в этом и заключается преимущество метода sampled softmax, которое позволяет экономить вычислительные ресурсы. Однако этот метод может привести к некачественному обучению из-за некорректного учета вероятностей — актуальна ли для пользователя рекомендация или нет. В результате модель будет давать неверные рекомендации.

Решение с помощью новой формулы

Для корректной работы метода требуется использовать обновленную формулу пересчета вероятностей того, что пользователь заинтересуется определенным товаром или контентом, — LogQ. Главная математическая трудность была в том, что существующие методы предполагают одинаковые правила отбора для всех примеров, а на практике положительные и отрицательные примеры попадают в данные по-разному. Из-за этого стандартные формулы начинают систематически искажать оценки, и требовалось специально скорректировать пересчет вероятностей, чтобы сделать модель объективнее.

Благодаря формуле модель при обучении начинает понимать, что реальные действия пользователя выбираются не случайным образом и явно задаются ей как положительные примеры, а остальные примеры — отрицательные и выбраны случайно. Это позволяет уменьшить смещения в оценках со стороны модели, то есть искажения, влияющие на точность ее финальных рекомендаций. В результате модель лучше понимает предпочтения пользователей и, как следствие, дает им более подходящие рекомендации.

Компании и разработчики могут использовать новую формулу при обучении любой рекомендательной системы. Для этого им не придется менять архитектуру своих моделей.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# машинное обучение

# программное обеспечение

# Яндекс

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Римское жречество: общая характеристика

Центр «Архэ»

Москва

Библиотека им. Н. А. Некрасова

Москва

Лекция

11 Мар

850 ₽

Настоящие мхи (Bryophyta): архитекторы зеленого ковра

Центр «Архэ»

Онлайн

Лекция

11 Мар

600 ₽

Самое крупное географическое открытие ХХ века

Московский Планетарий

Москва

Лекция

11 Мар

Бесплатно

Без истерики! История одного диагноза

ВДНХ

Москва

Лекция

11 Мар

800 ₽

Колониальная Америка: 1580-1760-е

Центр «Архэ»

Санкт-Петербург

Лекция

12 Мар

Бесплатно

Вторая квантовая революция

ФизТех

Москва

Лекция

12 Мар

Бесплатно

Мореплавательницы и летчицы

Библиотека иностранной литературы

Москва

Лекция

12 Мар

Бесплатно

Генеративный ИИ в медицине: визуализация, диагностика и цифровые двойники

Курилка Гутенберга

Москва

Популярное

За сутки

За неделю

За месяц

8 марта, 10:58

Татьяна Зайцева

Челюсть доисторического крокодила заставила усомниться в существовании Еврогондваны

Согласно гипотезе о так называемой Еврогондване, в эпоху динозавров Европа, как часть северного суперконтинента Лавразия, еще не полностью отделилась от южного суперконтинента Гондвана и животные могли свободно мигрировать между Европой и Африкой. Однако новый анализ найденных в Венгрии костей первобытного крокодила показал, что его сходство с гондванскими видами обусловлено не близким родством, а схожим образом жизни.

Палеонтология

# древние виды

# крокодилы

# лавразия

# меловой период

# формирование континентов

9 марта, 15:24

Александр Березин

Свободная торговля с США стимулировала рост числа убийств в Мексике

Треть века назад Штаты и Мексика подписали Североамериканское соглашение о свободной торговле. Авторы новой научной работы показали, что это спровоцировало рост войн между бандами и подъем смертности среди молодых мужчин на десятки процентов — но только в тех зонах, которые были интересны картелям. Всего после подписания соглашения в Мексике было убито (оценка с учетом исчезнувших трупов) более 0,85 миллиона человек.

История

# Мексика

# наркоторговля

# свободная торговля

# убийства

7 марта, 15:07

Игорь Байдов

NASA впервые изменило орбиту астероидов вокруг Солнца

Новые данные показали, что удар зонда DART не только изменил орбитальный период небольшого спутника Диморфа вокруг его «родителя» Дидима, но и вызвал небольшое изменение движения всей бинарной системы вокруг Солнца. Эти результаты укрепляют уверенность ученых в том, что технология кинетического удара, при заблаговременном обнаружении опасного объекта, может помочь отклонить потенциально опасный астероид от столкновения с Землей.

Астрономия

# DART

# NASA

# астероид

# астероиды

# Дидим

# Диморф

# Солнце

5 марта, 08:10

Александр Березин

Иран против США: технологические возможности стран на поле боя

Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.

Оружие и техника

# беспилотники

# военная техника

# ВПК

# ЗРК

# Израиль

# Иран

# сша

Выбор редакции

6 марта, 16:13

Губкинский университет

Запасы лития в России могут оказаться в разы больше прежних оценок

Запасы лития в России требуют переоценки и могут оказаться в разы выше, чем считалось до 2025 года. Об этом говорится в исследовании «Состояние ресурсной базы критически важных металлов и элементов для развития современных технологий», подготовленном учеными РГУ нефти и газа (НИУ) имени И.М. Губкина.

Губкинский университет

# добыча полезных ископаемых

# литий

# природные ресурсы

# Россия

# технологии

6 марта, 13:26

ФизТех

Гибридный метод помог точнее рассчитать распределение несмешивающихся жидкостей в пористой среде

Российские ученые из МФТИ с коллегами из Института прикладной математики им. М. В. Келдыша РАН и Института физики Земли им. О.Ю. Шмидта РАН разработали инновационный метод для расчета равновесного распределения несмешивающихся жидкостей в пористой среде. Результаты применения этого метода можно использовать в разработках по повышению нефтеотдачи и гидрологии, а также геологического СО2-хранения.

ФизТех

# жидкости

# моделирование

# нефть

# пористая среда

# технологии

# флюиды

12 февраля, 07:52

Адель Романова

В архивах NASA нашли записи о падении на Землю двух неизвестных межзвездных объектов

Астрономы недавно проанализировали базу данных о падающих на Землю объектах и пришли к выводу, что два из них прибыли из межзвездного пространства. Известна не только дата, но и место падения каждого из них.

Астрономия

# космос

# межзвездные объекты

# метеороиды

# падение метеорита

3 марта, 14:06

Александр Березин

Россия вернула себе возможность пилотируемых космических полетов

В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.

Космонавтика

# Байконур

# космонавтика

# космос

# Роскосмос

# Россия

12 февраля, 08:19

Полина Меньшова

Психологи выяснили, сколько раз за жизнь люди способны сильно влюбиться

«Любить лишь можно только раз», — писал поэт Сергей Есенин, а герои культовых сериалов приходили к выводу, что «настоящая» влюбленность случается в жизни максимум дважды. Однако ни один из этих тезисов не подкреплен научными данными. Американские исследователи подошли к вопросу иначе: опросили более 10 тысяч человек и вывели среднее число сильных влюбленностей, возможных в течение жизни.

Психология

# влюбленность

# любовь

# романтические отношения

# страсть

[miniorange_social_login]

Nikita, Google изначально был выдавал очень релевантный результат именно в научной сфере, статьи, Pubmed, патенты и др. Яндекс пытался мне что то впарить, и выдавал оч плохие по качеству статьи. Сейчас чуть лучше но засилье рекламы.

Ответить

Сергей Механик

09.09.2025

Nikita, полностью оценить этот перевод в настоящее время, к сожалению, мне сложновато, т. к. нет такого качественного доступа к ресурсу YouTube как у вас.

Ответить

Дождиков Антон

09.09.2025

Принципиальная ошибка в том, что разработчики Яндекса в этой статье кроме "болота" своих рекомендательных систем боятся нос высунуть в сторону. Эту задачу можно решать через глубокое обучение с подкреплением, ориентируясь не на правила, а на наработанный моделью опыт взаимодействия с реальными пользователями. Тут DRL-гибридная модель нужна. Тогда результат будет не 7%, а выше

Ответить

Дождиков Антон

09.09.2025

Ответить

Сергей Механик

09.09.2025

Яндекс уважаю и пользуюсь, но по-прежнему считаю, что Google лучше.

Ответить

—

Serjo Djachkowski

09.09.2025

Сергей, по ощущениям сплошная реклама и деньговыжимание, очень не доверяю.

Ответить

Nikita Lazarenko

09.09.2025

Ответить

ещё комментарии

Serjo Djachkowski

09.09.2025

Ответить

Сергей Механик

09.09.2025

Ответить

Дон Хуан Ай карамба

10.09.2025

Стратегия очень простая: рекомендуем бегуну купить велосипед --> а с велосипедистами работать мы уже умеем!

Ответить

Ярослав Экенберг

08.11.2025

А я-то думал новый рекламный баннер добавят, странный подход к решению проблемы, неяндексовский.

Ответить

Исследователи «Яндекса» представили способ повысить качество работы рекомендательных систем

Неточности при обучении рекомендательных систем

Решение с помощью новой формулы

По теме

Чего ожидать от нейросетей в будущем? Разговор с руководителем научного отдела «Яндекса» Артемом Бабенко

В ЛЭТИ предложили способ определения индивидуального профиля слуха

Популярное

Комментарии

Последние новости:

Свободная торговля с США стимулировала рост числа убийств в Мексике

Челюсть доисторического крокодила заставила усомниться в существовании Еврогондваны

NASA впервые изменило орбиту астероидов вокруг Солнца

Ученые выяснили состав самодельных чернил, которыми писали римские солдаты в Виндоланде

Иран против США: технологические возможности стран на поле боя

Воздушные космические двигатели: невероятно звучащая реальность

Ядерные технологии: не только электростанции

Гренландия: зачем на самом деле она нужна Трампу?

Последние комментарии

Самые обсуждаемые

Иран против США: технологические возможности стран на поле боя

Россия вернула себе возможность пилотируемых космических полетов

Моделирование парникового эффекта на Марсе привело к похолоданию вместо потепления

Физики выяснили, почему при отклеивании скотч издает визжащий звук