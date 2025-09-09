  • Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
9 сентября, 16:54
Редакция Naked Science
21

Исследователи «Яндекса» представили способ повысить качество работы рекомендательных систем

❋ 4.7

Исследователи рекомендательных технологий «Яндекса» нашли способ, как повысить качество работы рекомендательных систем, чтобы они лучше понимали предпочтения пользователей, например, в товарах или контенте, и составляли более точные рекомендации. Для этого исследователи внедрили дополнительную корректировку в процесс обучения таких моделей.

Технологии
# машинное обучение
# программное обеспечение
# Яндекс
Рекомендательные системы сегодня массовы, а их обучение превратилось в весьма ресурсоемкий процесс. Можно ли его облегчить? / © Вастрик, vas3k.blog

Внутреннее тестирование «Яндекса» показало, что новый подход позволяет повысить точность рекомендаций моделей в среднем на семь процентов по показателям качества ранжирования. «Яндекс» планирует использовать метод при обучении рекомендательных моделей собственных сервисов, в частности «Маркета». Метод будет полезен и другим компаниям, а также независимым разработчикам, работающим с рекомендательными системами в любой сфере — будь то соцсеть, интернет-магазин или стриминговый сервис.

О новом методе исследователи «Яндекса» рассказали в научной статье, которая была принята на ACM RecSys 2025. Это главная ежегодная международная конференция по рекомендательным системам, которая в этом году пройдет в девятнадцатый раз в Чехии. На конференцию также приняты работы крупнейших мировых технологических компаний — Amazon, Google и других.

Неточности при обучении рекомендательных систем

Рекомендательные системы обычно работают с миллионами объектов — текстами, аудио, видео, товарами. Это требует больших вычислительных ресурсов. Но сначала модель нужно обучить также на миллионах примеров, и для этого тоже необходимо много ресурсов. Чтобы сделать этот процесс менее ресурсоемким, во всем мире используют разные методы, которые заменяют сложные расчеты на более простые. Один из таких методов — sampled softmax, или алгоритм выборочного сэмплирования.

Его суть в том, что систему обучают различать предпочтения людей путем сравнения реализованных действий, которые пользователи совершили по отношению к конкретному объекту (положительные примеры), с нереализованными действиями, которых они не совершали относительно того же объекта (отрицательные примеры). В качестве объекта, например, может выступать определенный товар, тогда положительный пример — это добавление в корзину, а отрицательный — просмотр на сайте без добавления.

Обучение системы строится на том, что ей показывают положительный пример и отрицательные, — и благодаря этому модель начинает отличать одно от другого. Но можно показать ей миллионы отрицательных примеров из обучающего каталога, а можно лишь несколько случайно выбранных — в этом и заключается преимущество метода sampled softmax, которое позволяет экономить вычислительные ресурсы. Однако этот метод может привести к некачественному обучению из-за некорректного учета вероятностей — актуальна ли для пользователя рекомендация или нет. В результате модель будет давать неверные рекомендации.

Решение с помощью новой формулы

Для корректной работы метода требуется использовать обновленную формулу пересчета вероятностей того, что пользователь заинтересуется определенным товаром или контентом, — LogQ. Главная математическая трудность была в том, что существующие методы предполагают одинаковые правила отбора для всех примеров, а на практике положительные и отрицательные примеры попадают в данные по-разному. Из-за этого стандартные формулы начинают систематически искажать оценки, и требовалось специально скорректировать пересчет вероятностей, чтобы сделать модель объективнее.

Благодаря формуле модель при обучении начинает понимать, что реальные действия пользователя выбираются не случайным образом и явно задаются ей как положительные примеры, а остальные примеры — отрицательные и выбраны случайно. Это позволяет уменьшить смещения в оценках со стороны модели, то есть искажения, влияющие на точность ее финальных рекомендаций. В результате модель лучше понимает предпочтения пользователей и, как следствие, дает им более подходящие рекомендации.

Компании и разработчики могут использовать новую формулу при обучении любой рекомендательной системы. Для этого им не придется менять архитектуру своих моделей.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Технологии
# машинное обучение
# программное обеспечение
# Яндекс
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Telegram Дзен VK
Предстоящие мероприятия
Все
Лекция
09 Сен
Бесплатно
Нэко бунгаку, нэкономика и другие следы кошачьих лап в японской культуре
Центр «Архэ»
Москва
Лекция
09 Сен
Бесплатно
ИИ в медицине: от терапии до генетики
Курилка Гутенберга
Москва
Лекция
09 Сен
2700
Гиперсеть внутри головы. Как работает сознание
Прямая речь
Москва
Лекция
10 Сен
Бесплатно
Руки будущего: бионические протезы
Инжинириум МГТУ им. Н.Э. Баумана
Москва
Лекция
11 Сен
Бесплатно
Битва при Молодях — забытая победа
Библиотека им. М. Ю. Лермонтова
Санкт-Петербург
Лекция
11 Сен
Бесплатно
Александр II и народники
Библиотека На Стремянной
Санкт-Петербург
Лекция
11 Сен
Бесплатно
География природного и культурного наследия Арктики
Русское географическое общество
Санкт-Петербург
Лекция
11 Сен
Бесплатно
Морские разведчики и пехотинцы в боях с милитаристской Японией
Библиотека иностранной литературы
Москва
Лекция
11 Сен
Бесплатно
Человек и еж: история возникновения разума
ВДНХ
Москва

Популярное

За сутки
За неделю
За месяц
9 сентября, 11:03
Адель Романова

Рекордную скорость межзвездного объекта 3I/ATLAS не удалось объяснить

Третий известный межзвездный объект 3I/ATLAS летит примерно вдвое быстрее обоих своих предшественников. По расчетам, его вряд ли могло выбросить из родной планетной системы с подобной скоростью, и так разогнаться по пути он тоже не мог.

Астрономия
# космос
# межзвездная комета
# межзвездные объекты
8 сентября, 20:06
Evgenia Vavilova

Физики создали видимые человеку кристаллы времени

Ученые впервые смогли создать видимый в оптическом диапазоне темпоральный кристалл. Для этого они использовали жидкие кристаллы.

Физика
# жидкие кристаллы
# квантовые системы
# поляризация
# темпоральные кристаллы
9 сентября, 10:35
Игорь Байдов

Древняя статуэтка рассказала о моде на прически у охотников-собирателей

На севере Франции археологи нашли статуэтку женщины, пролежавшую в земле 27 тысяч лет. Искусно вырезанная фигурка сохранила не только облик человека из прошлого, но и мельчайшие детали его прически. По мнению авторов нового исследования, находка позволит понять моду и эстетические идеалы наших далеких предков, которые жили перед началом максимума последнего оледенения.

Археология
# венеры
# граветтская культура
# максимум последнего оледенения
# палеолит
# статуэтка
9 сентября, 11:03
Адель Романова

Рекордную скорость межзвездного объекта 3I/ATLAS не удалось объяснить

Третий известный межзвездный объект 3I/ATLAS летит примерно вдвое быстрее обоих своих предшественников. По расчетам, его вряд ли могло выбросить из родной планетной системы с подобной скоростью, и так разогнаться по пути он тоже не мог.

Астрономия
# космос
# межзвездная комета
# межзвездные объекты
8 сентября, 20:06
Evgenia Vavilova

Физики создали видимые человеку кристаллы времени

Ученые впервые смогли создать видимый в оптическом диапазоне темпоральный кристалл. Для этого они использовали жидкие кристаллы.

Физика
# жидкие кристаллы
# квантовые системы
# поляризация
# темпоральные кристаллы
6 сентября, 16:25
Evgenia Vavilova

Химики смогли добиться разложения водорода при комнатной температуре

Для разрыва связи между атомами водорода понадобились золото, титан и ультрафиолетовое излучение. Полученный водород ученые использовали для преобразования углекислого газа в этилен.

Химия
# водород
# Золото
# катализаторы
# молекулярный водород
# Ультрафиолет
3 сентября, 07:56
Адель Романова

Астрофизики назвали четыре возможных признака искусственного происхождения межзвездного объекта

Недавнее появление в Солнечной системе межзвездного объекта 3I/ATLAS вызвало новую волну обсуждения вопроса о том, как отличить комету или астероид от внеземного космического корабля либо другого артефакта, не созданного человечеством. Астрономы рассказали, что у искусственного объекта могут быть четыре характерные особенности.

Астрономия
# внеземные цивилизации
# космос
# межзвездные объекты
# Оумуамуа
12 августа, 11:29
Юлия Трепалина

Психологи узнали, в каких парах любовь сильнее — у нашедших друг друга онлайн или в жизни

Влияет ли формат знакомства на качество последующих романтических отношений в паре? Научные данные на этот счет разнятся. Новое исследование по вопросу представила группа психологов из Польши, Австралии и Великобритании. В попытке понять, при каком сценарии удовлетворенность отношениями выше, а любовь крепче — когда двое нашли друг друга в Сети или познакомились в жизни, — ученые опросили свыше 6000 тысяч человек из разных стран.

Психология
# знакомство
# интернет
# любовь
# онлайн-знакомство
# романтические отношения
# удовлетворенность отношениями
4 сентября, 13:59
Андрей П.

Рядом с Камчаткой нашли самую глубоководную экосистему хемосинтетической жизни

Глубоководная жизнь нам, сухопутным, кажется инопланетной. В недавней экспедиции морские биологи погрузились на дно пятого по глубине Курило-Камчатского желоба. Они преодолели 9500 метров толщи воды и встретили удивительно богатые сообщества организмов, живущих благодаря хемосинтезу. Тысячи километров дна покрывает беспозвоночная жизнь, которая питается благодаря бактериям, окисляющим метан. Naked Science поговорил с одним из авторов исследования.

Биология
# батискаф
# беспозвоночные
# глубина
# глубоководные животные
# субдукция
# фауна
[miniorange_social_login]

Комментарии

Написать комментарий

Последние новости:

  1. Исследователи «Яндекса» представили способ повысить качество работы рекомендательных систем

    9 сентября, 16:54

  2. Разработана защита для сетей 6G, которая работает как автоматические жалюзи

    9 сентября, 15:05

  3. Эксперимент показал, какие слова и действия лучше удерживают внимание младенцев

    9 сентября, 13:14

  4. Кальциевая гипотеза болезни Альцгеймера подтвердилась в экспериментах на мышах

    9 сентября, 13:05
Выбор редакции

Шестое по силе: что сделало камчатское землетрясение уникальным и почему никто не погиб

1 августа, 09:51

Последние комментарии

Сергей Механик
33 минуты назад
Контроль и защита связи как никогда важны в настоящее сложное время. 👍

Разработана защита для сетей 6G, которая работает как автоматические жалюзи

Алексей Мельдианов
42 минуты назад
Я бы китайцам предложил накапливать электроэнергию солнечных батарей с помощью натрий-ионных батареи это дешевле чем литиевые батареи пусть по

Китай терпит миллиардные убытки из-за солнечных панелей

Alex Grey
57 минут назад
А она не в лоб движению солнца летит? Скорости там сложились, всё такое.

Рекордную скорость межзвездного объекта 3I/ATLAS не удалось объяснить

Nikita Lazarenko
1 час назад
Наша СС движется в диске галактики около 220 км/с, где можно представить что она не залетела к нам а мы ее догнали. Но тут тоже странно, угол СС

Рекордную скорость межзвездного объекта 3I/ATLAS не удалось объяснить

Гриша Черных
1 час назад
Есть и ещё одна очень интересная причина настолько позднего перевода экономики германии на военные рельсы. Немцы конечно могли провернуть это

Неудобный хам. Почему на самом деле СССР победил Германию

Дождиков Антон
1 час назад
Подлетит поближе - посмотрим!

Рекордную скорость межзвездного объекта 3I/ATLAS не удалось объяснить

Сергей Механик
1 час назад
А мне кажется, если показать сиську, то это удержит внимание любого. 😉

Эксперимент показал, какие слова и действия лучше удерживают внимание младенцев

Andy Caufman
2 часа назад
Андрей, ты чего такое говоришь?! 21к больше 17к, а больше всегда лучше. Опять чертовым пендосам нос утерли! Наши слоняры!

Инфографика: источники пластикового мусора в Мировом океане

Питон Удав
2 часа назад
Серьёзно? Макс придумал старлинк, хотя это нерентабельно? И стал выводить спутники себе в убыток? На сотнях ракет? Вы что пишите? Особенно на фоне

SpaceX провела крупнейшую сделку в истории космической связи с целью монополизировать рынок

Andriy Mazhuga
2 часа назад
Александр, Що за "скоро"? Це рашиською? Армія підарусні вже приходила, я був в окупації. Спочатку була еліта. Потім прийшли буряти і інші опущені

Карта: самые влиятельные паспорта крупнейших стран в 2025 году

SuperTurg
2 часа назад
Александр, в Вы знаете украинский (где-то учили) или через переводчик? Просто неожиданно, что решили отвечать на языке комментатора.

Карта: самые влиятельные паспорта крупнейших стран в 2025 году

Иван Колупаев
2 часа назад
Andriy, до кінця життя это может оказаться неожиданно быстро.

Карта: самые влиятельные паспорта крупнейших стран в 2025 году

Dmitriy Dorian
2 часа назад
Nikita, хорошо, что вам со мной всё понятно, потому что мне самому с собой понятно далеко не всё :)

Астрономы, вероятно, отыскали самую древнюю галактику

Thomass man
3 часа назад
Григорий, работа журналиста - освещать. А угроза может исходить от политики другой страны. реально психолог в помощь может?

Шесть поколений американских истребителей — история в инфографике

Александр Березин
3 часа назад
Andriy, нічого. Скоро російська армія прийде і дасть тобі більше можливостей вивчити українське правописання.

Карта: самые влиятельные паспорта крупнейших стран в 2025 году

Nikita Lazarenko
3 часа назад
Dmitriy, ну вот с тобой и все понятно, риверсивный интеллектуал

Астрономы, вероятно, отыскали самую древнюю галактику

Dmitriy Dorian
4 часа назад
Nikita, вы такой решительный и образованный, вы так виртуозно выстраиваете вашу аргументацию, что мне просто нечего противопоставить. Особенно таким

Астрономы, вероятно, отыскали самую древнюю галактику

Andriy Mazhuga
4 часа назад
Александр, ти правий, не було часу перевіряти написане, пальці широкі, - букви не ті написав. Це дрібниці. Підарусня розвалила мій будинок і моє

Карта: самые влиятельные паспорта крупнейших стран в 2025 году

Dmitriy Dorian
4 часа назад
Сергей, в науке вообще нет стопроцентных оснований ни для чего, этим она от религии отличается :) Просто исходя из уровня современных знаний, есть

Насколько далеки галактики от Млечного Пути?

skygoo _
4 часа назад
Нет никакого 6 поколения, это всё презенташки. Да и 5 здесь представлено давно снятым с производства ф22. Какой смысл указывать его цену, если он

Шесть поколений американских истребителей — история в инфографике

Самые обсуждаемые

Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно