• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
28.10.2024, 15:59
Редакция Naked Science
251

Российские ученые повысили точность рекомендательных систем для соцсетей и онлайн-магазинов на 50 процентов

❋ 4.6

Сотрудники лаборатории исследований искусственного интеллекта T-Bank AI Research существенно улучшили работу автоматизированной рекомендательной системы. Ключевым звеном в их решении стала существенная оптимизация одного из самых популярных алгоритмов для подбора рекомендаций.

Оптимизированный алгоритм назван по имени британского математика и священника Томаса Байеса, чьи подходы к анализу вероятностей нашли в нем применение / © Wikimedia Commons

Научная группа из T-Bank AI Research серьезно оптимизировала алгоритм байесовского персонализированного ранжирования (БПР) — один из ключевых компонентов рекомендательных систем современных соцсетей и онлайн-магазинов. Именно на ее основе реализованы почти все новостные ленты в соцсетях, как и рекомендации пользователям при онлайн-шопинге.

Этот алгоритм анализирует множество переменных и их вероятностных зависимостей так, чтобы уловить, какие именно действия человека в соцсети (или потенциального покупателя в магазине) чаще всего вероятностно связаны с его выбором того, на какую именно новость, пост или товар он хочет кликнуть. БПР крайне популярно из-за относительно умеренных требований к ресурсам при достаточно высокой эффективности.

Авторы новой работы представили ее на ключевой Всемирной конференции по рекомендательным системам ACM RecSys, которая прошла с 14 по 18 октября в Бари (Италия). Текст принят к публикации в сборнике работ конференции Reproducibility track of the ACM RecSys и доступен на сервере препринтов Корнеллского университета. Исследователи взялись проанализировать, в каких именно случаях БПР справляется со своими задачами хуже или лучше обычного.

В результате ученым удалось показать, что практическая реализация БПР часто бывает весьма разной и в целом ряде случаев как минимум неоптимальна. Исходная научная работа о БПР, вышедшая 15 лет назад, хотя и получила едва ли не семь тысяч цитирований в других научных статьях, похоже, не всегда достаточно тщательно изучалась теми, кто брался за ее реализацию. По оценкам исследователей, итоговое снижение эффективности алгоритма в реализации может достигать 50% от максимальной, теоретически возможной, эффективности.

Результаты воспроизведения оригинального алгоритма в сравнении с моделями из разных опенсорс-фреймворков. Модель авторов работы (Ours) превосходит модели из большинства опенсорс-фреймворков  / ©  Лаборатория T-Bank AI Research

Авторы не ограничились этим выводом. Они также создали свою модель БПР и тщательно настроили ее гиперпараметры (так называют параметры, настраиваемые до запуска модели и неизменяемые в процессе ее работы). Затем протестировали ее эффективность на задачах из реального мира. Результаты оказались выше, чем у других реализаций модели.

Например, производительность в точных рекомендациях вышла на 50% выше, чем у модели из популярного опенсорс-фреймворка RecBole. Кроме того, она была на 10% выше, чем у модели Mult-VAE. Отметим, что Mult-VAE — модель для рекомендательных систем, основанная на нейронных сетях (разработка лаборатории Netflix), и считается одним из лидеров в отрасли, если не бесспорным лидером.

Сравнение эффективности для всех моделей шло по одному сценарию на одном и том же наборе данных — так называемом Наборе из миллиона песен. Критерием точности работы модели было то, насколько точно первые сделанные ею 100 рекомендаций совпали с интересами пользователя, проходящего через модель.

Поскольку работа исследователей из научно-исследовательской лаборатории T-Bank AI Research теперь в открытом доступе (и есть на GitHub), ее могут применять разработчики по всему миру для оптимизации самых разных рекомендательных систем. Это позволит покупателям быстрее находить нужные им товары в интернет-магазинах, а пользователям соцсетей — получать более осмысленную выдачу в лентах новостей и подписках. Как не раз отмечал Naked Science, проблемы с такими лентами давно стали буквально бичом для множества современных людей.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
18 января, 11:45
Игорь Байдов

Повторное изучение окаменелости галлюцигении, впервые описанной в 1970-х годах, помогло палеонтологам больше узнать о рационе этого древнего существа. Ответ на вопрос о питании нашли не в ее останках, а на теле предполагаемой добычи.

19 января, 07:55
Игорь Байдов

Растительная диета давно стала золотым стандартом для тех, кто мечтает о долгой и здоровой жизни. Но китайские ученые внесли серьезные коррективы в этот постулат. Они обнаружили, что большинство местных долгожителей, перешагнувших столетний рубеж, регулярно употребляют в пищу мясо. Особенно заметна эта связь у одной специфической группы пожилых людей, что заставляет по-новому взглянуть на диетические рекомендации для самых старших поколений.

19 января, 16:04
Редакция Naked Science

Наш организм не синхронизирован с современным образом жизни и это создает нам много проблем: мы переедаем, страдаем депрессиями и болезнями сердца. Коренным образом с этим бороться нельзя, по крайней мере, не вернувшись к жизни охотников-собирателей. Но значительной части этих проблем вполне можно помочь… носимым устройством. Причем это не далекая перспектива, а реальность уже наших дней.

18 января, 11:45
Игорь Байдов

Повторное изучение окаменелости галлюцигении, впервые описанной в 1970-х годах, помогло палеонтологам больше узнать о рационе этого древнего существа. Ответ на вопрос о питании нашли не в ее останках, а на теле предполагаемой добычи.

16 января, 15:28
ФизТех

Международная научная группа при участии МФТИ разработала композитный гель-полимерный электролит для аккумуляторов. Этот материал позволит создать безопасные высокомощные батареи, что важно для электромобилей, гаджетов и систем хранения энергии.

13 января, 10:59
НИУ ВШЭ

Исследователи Центра языка и мозга ВШЭ с помощью магнитоэнцефалографии изучили, как мозг взрослых и детей реагирует на слова при чтении. Они показали, что у детей мозг дольше обрабатывает даже часто употребляющиеся в речи слова, а слова, которые встречаются редко, и псевдослова обрабатывает одинаково — медленно и по частям. С возрастом система перестраивается: высокочастотные слова переходят на быстрый маршрут, а вот новые сочетания букв по-прежнему анализируются медленно.

12 января, 15:39
Александр Березин

От рыб произошли все наземные позвоночные, включая нас, но как именно рыбы стали главным населением морей — до последнего времени оставалось неясным. Авторы новой научной работы попытались доказать, что причиной этого было вымирание, возможно, вызванное белыми ночами.

23.12.2025, 10:51
Игорь Байдов

Среди самых интригующих открытий космического телескопа «‎Джеймс Уэбб» — компактные объекты, получившие название «маленькие красные точки». Их видели только в самых дальних уголках Вселенной. Большинство возникло в первый миллиард лет после Большого взрыва, и ученые предполагали, что такие источники представляют собой небольшие компактные галактики. Однако международная команда астрономов пришла к иному выводу. Они предположили, что на самом деле «маленькие красные точки» — черные дыры, окруженные массивной газовой оболочкой.

2 января, 12:27
Адель Романова

Ученые задались вопросом: почему два расположенных по соседству спутника Юпитера такие разные, ведь на Ио повсеместно извергаются вулканы, а Европа полностью покрыта многокилометровой коркой льда. Есть версия, что Ио когда-то тоже была богата водой, но по итогам недавнего исследования это сочли неправдоподобным.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно