9 сентября, 16:54

Редакция Naked Science

2,2 тыс

Исследователи «Яндекса» представили способ повысить качество работы рекомендательных систем

❋ 4.7

Исследователи рекомендательных технологий «Яндекса» нашли способ, как повысить качество работы рекомендательных систем, чтобы они лучше понимали предпочтения пользователей, например, в товарах или контенте, и составляли более точные рекомендации. Для этого исследователи внедрили дополнительную корректировку в процесс обучения таких моделей.

Технологии

# машинное обучение

# программное обеспечение

# Яндекс

Рекомендательные системы сегодня массовы, а их обучение превратилось в весьма ресурсоемкий процесс. Можно ли его облегчить? / © Вастрик, vas3k.blog

Внутреннее тестирование «Яндекса» показало, что новый подход позволяет повысить точность рекомендаций моделей в среднем на семь процентов по показателям качества ранжирования. «Яндекс» планирует использовать метод при обучении рекомендательных моделей собственных сервисов, в частности «Маркета». Метод будет полезен и другим компаниям, а также независимым разработчикам, работающим с рекомендательными системами в любой сфере — будь то соцсеть, интернет-магазин или стриминговый сервис.

О новом методе исследователи «Яндекса» рассказали в научной статье, которая была принята на ACM RecSys 2025. Это главная ежегодная международная конференция по рекомендательным системам, которая в этом году пройдет в девятнадцатый раз в Чехии. На конференцию также приняты работы крупнейших мировых технологических компаний — Amazon, Google и других.

Неточности при обучении рекомендательных систем

Рекомендательные системы обычно работают с миллионами объектов — текстами, аудио, видео, товарами. Это требует больших вычислительных ресурсов. Но сначала модель нужно обучить также на миллионах примеров, и для этого тоже необходимо много ресурсов. Чтобы сделать этот процесс менее ресурсоемким, во всем мире используют разные методы, которые заменяют сложные расчеты на более простые. Один из таких методов — sampled softmax, или алгоритм выборочного сэмплирования.

Его суть в том, что систему обучают различать предпочтения людей путем сравнения реализованных действий, которые пользователи совершили по отношению к конкретному объекту (положительные примеры), с нереализованными действиями, которых они не совершали относительно того же объекта (отрицательные примеры). В качестве объекта, например, может выступать определенный товар, тогда положительный пример — это добавление в корзину, а отрицательный — просмотр на сайте без добавления.

Обучение системы строится на том, что ей показывают положительный пример и отрицательные, — и благодаря этому модель начинает отличать одно от другого. Но можно показать ей миллионы отрицательных примеров из обучающего каталога, а можно лишь несколько случайно выбранных — в этом и заключается преимущество метода sampled softmax, которое позволяет экономить вычислительные ресурсы. Однако этот метод может привести к некачественному обучению из-за некорректного учета вероятностей — актуальна ли для пользователя рекомендация или нет. В результате модель будет давать неверные рекомендации.

Решение с помощью новой формулы

Для корректной работы метода требуется использовать обновленную формулу пересчета вероятностей того, что пользователь заинтересуется определенным товаром или контентом, — LogQ. Главная математическая трудность была в том, что существующие методы предполагают одинаковые правила отбора для всех примеров, а на практике положительные и отрицательные примеры попадают в данные по-разному. Из-за этого стандартные формулы начинают систематически искажать оценки, и требовалось специально скорректировать пересчет вероятностей, чтобы сделать модель объективнее.

Благодаря формуле модель при обучении начинает понимать, что реальные действия пользователя выбираются не случайным образом и явно задаются ей как положительные примеры, а остальные примеры — отрицательные и выбраны случайно. Это позволяет уменьшить смещения в оценках со стороны модели, то есть искажения, влияющие на точность ее финальных рекомендаций. В результате модель лучше понимает предпочтения пользователей и, как следствие, дает им более подходящие рекомендации.

Компании и разработчики могут использовать новую формулу при обучении любой рекомендательной системы. Для этого им не придется менять архитектуру своих моделей.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# машинное обучение

# программное обеспечение

# Яндекс

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Выучить нельзя забыть: как работает наша память

ВДНХ

Москва

Лекция

10 Ноя

650 ₽

Самое раннее первобытное искусство (палеолит)

Центр «Архэ»

Санкт-Петербург

Лекция

11 Ноя

900 ₽

Собакообразные хищники: от стайных охотников до морских адаптаций

Центр «Архэ»

Москва

Лекция

11 Ноя

600 ₽

Лишайники в экосистеме

Центр «Архэ»

Санкт-Петербург

Лекция

11 Ноя

750 ₽

Династическая война XV в. и формирование Российского государства при Иване III

Центр «Архэ»

Онлайн

Лекция

12 Ноя

600 ₽

Уникальная Солнечная система

Московский Планетарий

Москва

Лекция

12 Ноя

1000 ₽

Как хоронили людей в палеолите

ВСмысле

Санкт-Петербург

Лекция

12 Ноя

Бесплатно

Откуда астрономы это знают?

Библиотека им. Н. А. Некрасова

Москва

Лекция

13 Ноя

Бесплатно

«Запрещенная» химия, или как школьные двоечники оказались правы

ВДНХ

Москва

Популярное

За сутки

За неделю

За месяц

8 ноября, 18:29

Адель Романова

Астрономы вычислили, откуда на Землю прилетают межзвездные объекты

По расчетам, большинство «гостей» вроде Оумуамуа или нынешнего 3I/ATLAS летят к Земле примерно со стороны созвездия Геркулес. Скорее всего, они время от времени падают на нашу планету, просто мы еще не научились это замечать. Как удалось вычислить, чаще всего они должны падать зимой и где-то в окрестностях экватора.

Астрономия

# космос

# межзвездные объекты

# Солнечная система

7 ноября, 17:56

МГППУ

Межнациональные браки: как языковой барьер и религия повлияли на русскоязычных жен норвежцев и эмиратцев

Женщины из России и стран СНГ иногда вступают в браки с иностранцами. Такие межнациональные союзы предполагают сосуществование различных культур в одной семье, что может привести как к взаимному обогащению культурного опыта и расширению кругозора, так и к определенным конфликтам и недопониманиям. Психологи из Московского государственного психолого-педагогического университета (МГППУ) провели исследование, посвященное восприятию культурных различий русскоговорящими женщинами, состоящими в межкультурных браках с норвежцами или жителями Объединенных Арабских Эмиратов.

МГППУ

# брак

# Норвегия

# ОАЭ

# Психология

# религия

# свадьба

# традиция

# языковой барьер

6 ноября, 13:39

Юлия Трепалина

Риск стать жертвой сексуального насилия у студенток оказался на 75% выше, чем у сверстниц не из вузов

Девушки, посещающие университет или колледж, рискуют пострадать от сексуального насилия гораздо больше, чем их сверстницы, не получающие высшее образование. Особенно велика опасность для проживающих в студенческих городках, выяснили американские исследователи.

Психология

# вузы

# женщины

# кампус

# сексуальное насилие

# студенты

5 ноября, 14:23

Юлия Трепалина

Ученые раскрыли секрет суперспособности людей запоминать и узнавать лица

Некоторые исключительно хорошо узнают ранее увиденные незнакомые лица. Такие свидетели не раз помогали раскрывать преступления. Психологи из Австралии, изучающие этот тип людей, которых они назвали «суперузнавателями», в новом исследовании привлекли искусственный интеллект, чтобы разобраться, в чем секрет суперспособности.

Психология

# искусственный интеллект

# нейросети

# память на лица

# распознавание лиц

# способность

6 ноября, 14:04

Илья Гриднев

Древнейший город майя оказался ритуальной картой Вселенной

Гигантский комплекс Агуада-Феникс в Мексике, древнейшее монументальное сооружение в зоне расселения майя, был построен как модель Вселенной. На это указали его общая планировка и найденный в центре ритуальный тайник с цветными пигментами, расположенными по сторонам света.

Археология

# майя

# Мезоамерика

# ритуалы

4 ноября, 12:55

Игорь Байдов

Косатки напали на белых акул, чтобы полакомиться их печенью

Морские биологи стали свидетелями любопытной тактики охоты. Стаи косаток целенаправленно атакуют молодых белых акул: переворачивают их брюхом вверх, вызывая временный паралич, а затем выедают печень. Ученые впервые засняли на видео этот тип охоты и считают, что речь идет о новой, ранее неизвестной группе косаток, которые специализируются именно на таких нападениях.

Биология

# акулы

# животные

# косатки

# охота

25 октября, 10:40

Любовь С.

Недалеко от Солнечной системы нашли потенциально обитаемую суперземлю

Проанализировав данные наблюдений, полученных с помощью наземных обсерваторий за последние два десятилетия, астрономы обнаружили потенциально обитаемый мир — суперземлю Gliese 251 c (GJ 251 с). Планета обращается вокруг красного карлика на расстоянии около 18 световых лет от Земли и считается одним из самых перспективных кандидатов для поисков жизни.

Астрономия

# звезды

# зона обитаемости

# красный карлик

# спектрограф

# Суперземля

# телескопы

13 октября, 11:10

Илья Гриднев

Движение жидкости в мозге предложили считать основой сознания

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

Биология

# мозг

# сознание

# электромагнитное поле

24 октября, 14:02

РТУ МИРЭА

Эксперт рассказал, какие приборы нельзя подключать к удлинителю и почему

В современном доме, насыщенном разнообразной техникой, удлинители стали незаменимым атрибутом, позволяющим обеспечить электропитанием все необходимые устройства. Однако мало кто задумывается, что привычное использование этого аксессуара может нести серьезную угрозу безопасности. По статистике, значительная часть бытовых пожаров происходит из-за неправильной эксплуатации электропроводки и вспомогательных устройств. Какие приборы категорически нельзя подключать через удлинители и почему это может привести к трагическим последствиям, рассказывает профессор кафедры наноэлектроники РТУ МИРЭА, доктор физико-математических наук Алексей Юрасов.

РТУ МИРЭА

# безопасность

# бытовые приборы

# пожары

# удлинитель

# электричество

# электропроводка

[miniorange_social_login]

Nikita, Google изначально был выдавал очень релевантный результат именно в научной сфере, статьи, Pubmed, патенты и др. Яндекс пытался мне что то впарить, и выдавал оч плохие по качеству статьи. Сейчас чуть лучше но засилье рекламы.

Ответить

Сергей Механик

09.09.2025

Nikita, полностью оценить этот перевод в настоящее время, к сожалению, мне сложновато, т. к. нет такого качественного доступа к ресурсу YouTube как у вас.

Ответить

Дождиков Антон

09.09.2025

Принципиальная ошибка в том, что разработчики Яндекса в этой статье кроме "болота" своих рекомендательных систем боятся нос высунуть в сторону. Эту задачу можно решать через глубокое обучение с подкреплением, ориентируясь не на правила, а на наработанный моделью опыт взаимодействия с реальными пользователями. Тут DRL-гибридная модель нужна. Тогда результат будет не 7%, а выше

Ответить

Дождиков Антон

09.09.2025

Ответить

Сергей Механик

09.09.2025

Яндекс уважаю и пользуюсь, но по-прежнему считаю, что Google лучше.

Ответить

—

Serjo Djachkowski

09.09.2025

Сергей, по ощущениям сплошная реклама и деньговыжимание, очень не доверяю.

Ответить

Nikita Lazarenko

09.09.2025

Ответить

ещё комментарии

Serjo Djachkowski

09.09.2025

Ответить

Сергей Механик

09.09.2025

Ответить

Иван Козенков

10.09.2025

Стратегия очень простая: рекомендуем бегуну купить велосипед --> а с велосипедистами работать мы уже умеем!

Ответить

Ярослав Экенберг

6 часов назад

А я-то думал новый рекламный баннер добавят, странный подход к решению проблемы, неяндексовский.

Ответить

Исследователи «Яндекса» представили способ повысить качество работы рекомендательных систем

Неточности при обучении рекомендательных систем

Решение с помощью новой формулы

По теме

Чего ожидать от нейросетей в будущем? Разговор с руководителем научного отдела «Яндекса» Артемом Бабенко

В ЛЭТИ предложили способ определения индивидуального профиля слуха

Популярное

Комментарии

Последние новости:

Астрономы вычислили, откуда на Землю прилетают межзвездные объекты

Палеонтологи смоделировали совокупление утконосых динозавров

Межнациональные браки: как языковой барьер и религия повлияли на русскоязычных жен норвежцев и эмиратцев

Под антарктическими льдами: искусственный интеллект научили обнаруживать и классифицировать океанические вихри

Атом через 100 лет: как ядерная энергия изменит будущее человечества

Как Россия стала одним из лидеров квантовой гонки — и что планирует получить в результате

Становление: как советская атомная отрасль смогла то, что у других не вышло

Антропологи предложили переписать всю историю человечества за последний миллион лет

Последние комментарии

Самые обсуждаемые

Вселенная перешла к фазе замедленного расширения, а темная энергия ослабевает

Ученые увидели опасность для природы и людей в фейковых ИИ-видео с дикими животными

Ученые раскрыли секрет суперспособности людей запоминать и узнавать лица

Астрофизики нашли объяснение необычным свойствам межзвездной кометы 3I/ATLAS