• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
28.10.2024, 15:59
Редакция Naked Science
250

Российские ученые повысили точность рекомендательных систем для соцсетей и онлайн-магазинов на 50 процентов

❋ 4.6

Сотрудники лаборатории исследований искусственного интеллекта T-Bank AI Research существенно улучшили работу автоматизированной рекомендательной системы. Ключевым звеном в их решении стала существенная оптимизация одного из самых популярных алгоритмов для подбора рекомендаций.

Оптимизированный алгоритм назван по имени британского математика и священника Томаса Байеса, чьи подходы к анализу вероятностей нашли в нем применение / © Wikimedia Commons

Научная группа из T-Bank AI Research серьезно оптимизировала алгоритм байесовского персонализированного ранжирования (БПР) — один из ключевых компонентов рекомендательных систем современных соцсетей и онлайн-магазинов. Именно на ее основе реализованы почти все новостные ленты в соцсетях, как и рекомендации пользователям при онлайн-шопинге.

Этот алгоритм анализирует множество переменных и их вероятностных зависимостей так, чтобы уловить, какие именно действия человека в соцсети (или потенциального покупателя в магазине) чаще всего вероятностно связаны с его выбором того, на какую именно новость, пост или товар он хочет кликнуть. БПР крайне популярно из-за относительно умеренных требований к ресурсам при достаточно высокой эффективности.

Авторы новой работы представили ее на ключевой Всемирной конференции по рекомендательным системам ACM RecSys, которая прошла с 14 по 18 октября в Бари (Италия). Текст принят к публикации в сборнике работ конференции Reproducibility track of the ACM RecSys и доступен на сервере препринтов Корнеллского университета. Исследователи взялись проанализировать, в каких именно случаях БПР справляется со своими задачами хуже или лучше обычного.

В результате ученым удалось показать, что практическая реализация БПР часто бывает весьма разной и в целом ряде случаев как минимум неоптимальна. Исходная научная работа о БПР, вышедшая 15 лет назад, хотя и получила едва ли не семь тысяч цитирований в других научных статьях, похоже, не всегда достаточно тщательно изучалась теми, кто брался за ее реализацию. По оценкам исследователей, итоговое снижение эффективности алгоритма в реализации может достигать 50% от максимальной, теоретически возможной, эффективности.

Результаты воспроизведения оригинального алгоритма в сравнении с моделями из разных опенсорс-фреймворков. Модель авторов работы (Ours) превосходит модели из большинства опенсорс-фреймворков  / ©  Лаборатория T-Bank AI Research

Авторы не ограничились этим выводом. Они также создали свою модель БПР и тщательно настроили ее гиперпараметры (так называют параметры, настраиваемые до запуска модели и неизменяемые в процессе ее работы). Затем протестировали ее эффективность на задачах из реального мира. Результаты оказались выше, чем у других реализаций модели.

Например, производительность в точных рекомендациях вышла на 50% выше, чем у модели из популярного опенсорс-фреймворка RecBole. Кроме того, она была на 10% выше, чем у модели Mult-VAE. Отметим, что Mult-VAE — модель для рекомендательных систем, основанная на нейронных сетях (разработка лаборатории Netflix), и считается одним из лидеров в отрасли, если не бесспорным лидером.

Сравнение эффективности для всех моделей шло по одному сценарию на одном и том же наборе данных — так называемом Наборе из миллиона песен. Критерием точности работы модели было то, насколько точно первые сделанные ею 100 рекомендаций совпали с интересами пользователя, проходящего через модель.

Поскольку работа исследователей из научно-исследовательской лаборатории T-Bank AI Research теперь в открытом доступе (и есть на GitHub), ее могут применять разработчики по всему миру для оптимизации самых разных рекомендательных систем. Это позволит покупателям быстрее находить нужные им товары в интернет-магазинах, а пользователям соцсетей — получать более осмысленную выдачу в лентах новостей и подписках. Как не раз отмечал Naked Science, проблемы с такими лентами давно стали буквально бичом для множества современных людей.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
19 октября, 10:00
Любовь С.

Первый официальный документ, описывающий принцип действий в случае возможного контакта с внеземной цивилизацией, был принят Международной академией астронавтики (IAA) в 1989 году. С тех пор декларацию неоднократно пересматривали, а ее обновленную версию, адаптированную под реалии XXI века, ученые разработали совместно с участниками проекта по поиску инопланетян SETI.

20 октября, 10:40
Юлия Трепалина

Индийские психиатры описали необычное психическое расстройство у мужчины с алкогольной зависимостью. Так называемый синдром инкуба, сопровождаемый сексуальными галлюцинациями, развился у пациента при попытке сократить потребление спиртного.

20 октября, 12:07
Александр Березин

Парадокс Циолковского — Ферми сформулировали почти век назад: во Вселенной много звезд, у них — планет. Почему же мы не видим следов других цивилизаций в небе? Автор новой гипотезы считает, что все дело в нейросетях.

17 октября, 22:00
Любовь С.

В густой оранжевой дымке Титана, где температура опускается до минус 180 градусов Цельсия, происходят невозможные по земным меркам химические реакции: молекула циановодорода (HCN), рожденная в атмосфере из азота, метана и этана, могла сформировать кристаллы, объединяющие вещества противоположной природы.

19 октября, 10:00
Любовь С.

Первый официальный документ, описывающий принцип действий в случае возможного контакта с внеземной цивилизацией, был принят Международной академией астронавтики (IAA) в 1989 году. С тех пор декларацию неоднократно пересматривали, а ее обновленную версию, адаптированную под реалии XXI века, ученые разработали совместно с участниками проекта по поиску инопланетян SETI.

18 октября, 11:06
Evgenia Vavilova

Число несущих их клеток не просто увеличивается, механизм отбора связан с эволюционным преимуществом половых клеток. Узнать об этом помог улучшенный метод секвенирования ДНК.

13 октября, 11:10
Илья Гриднев

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

26 сентября, 11:41
ИИМК РАН

Археологи Института истории материальной культуры РАН (ИИМК РАН), при поддержке фонда «История отечества» в ходе раскопок обнаружили на всемирно известной стоянке каменного века Костенки-17 в Воронежской области редчайшие украшения из зубов песца и окаменелой раковины, а также уникальный для этого времени нуклеус из бивня мамонта для снятия заготовок.

7 октября, 11:46
Игорь Байдов

Экспедиционное судно «Эндьюранс» более века называли самым прочным деревянным судном, когда-либо построенным человеком. Но находка, сделанная на дне моря, и изучение старых писем раскрыли неприятную правду. Легендарный «Эндьюранс» Шеклтона вовсе не был непобедимым левиафаном. Напротив, он имел фатальные недостатки, а капитан знал об этом еще до того, как ушел в роковое плавание к берегам Антарктиды.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно