Российские ученые повысили точность рекомендательных систем для соцсетей и онлайн-магазинов на 50 процентов
Сотрудники лаборатории исследований искусственного интеллекта T-Bank AI Research существенно улучшили работу автоматизированной рекомендательной системы. Ключевым звеном в их решении стала существенная оптимизация одного из самых популярных алгоритмов для подбора рекомендаций.
Научная группа из T-Bank AI Research серьезно оптимизировала алгоритм байесовского персонализированного ранжирования (БПР) — один из ключевых компонентов рекомендательных систем современных соцсетей и онлайн-магазинов. Именно на ее основе реализованы почти все новостные ленты в соцсетях, как и рекомендации пользователям при онлайн-шопинге.
Этот алгоритм анализирует множество переменных и их вероятностных зависимостей так, чтобы уловить, какие именно действия человека в соцсети (или потенциального покупателя в магазине) чаще всего вероятностно связаны с его выбором того, на какую именно новость, пост или товар он хочет кликнуть. БПР крайне популярно из-за относительно умеренных требований к ресурсам при достаточно высокой эффективности.
Авторы новой работы представили ее на ключевой Всемирной конференции по рекомендательным системам ACM RecSys, которая прошла с 14 по 18 октября в Бари (Италия). Текст принят к публикации в сборнике работ конференции Reproducibility track of the ACM RecSys и доступен на сервере препринтов Корнеллского университета. Исследователи взялись проанализировать, в каких именно случаях БПР справляется со своими задачами хуже или лучше обычного.
В результате ученым удалось показать, что практическая реализация БПР часто бывает весьма разной и в целом ряде случаев как минимум неоптимальна. Исходная научная работа о БПР, вышедшая 15 лет назад, хотя и получила едва ли не семь тысяч цитирований в других научных статьях, похоже, не всегда достаточно тщательно изучалась теми, кто брался за ее реализацию. По оценкам исследователей, итоговое снижение эффективности алгоритма в реализации может достигать 50% от максимальной, теоретически возможной, эффективности.

Авторы не ограничились этим выводом. Они также создали свою модель БПР и тщательно настроили ее гиперпараметры (так называют параметры, настраиваемые до запуска модели и неизменяемые в процессе ее работы). Затем протестировали ее эффективность на задачах из реального мира. Результаты оказались выше, чем у других реализаций модели.
Например, производительность в точных рекомендациях вышла на 50% выше, чем у модели из популярного опенсорс-фреймворка RecBole. Кроме того, она была на 10% выше, чем у модели Mult-VAE. Отметим, что Mult-VAE — модель для рекомендательных систем, основанная на нейронных сетях (разработка лаборатории Netflix), и считается одним из лидеров в отрасли, если не бесспорным лидером.
Сравнение эффективности для всех моделей шло по одному сценарию на одном и том же наборе данных — так называемом Наборе из миллиона песен. Критерием точности работы модели было то, насколько точно первые сделанные ею 100 рекомендаций совпали с интересами пользователя, проходящего через модель.
Поскольку работа исследователей из научно-исследовательской лаборатории T-Bank AI Research теперь в открытом доступе (и есть на GitHub), ее могут применять разработчики по всему миру для оптимизации самых разных рекомендательных систем. Это позволит покупателям быстрее находить нужные им товары в интернет-магазинах, а пользователям соцсетей — получать более осмысленную выдачу в лентах новостей и подписках. Как не раз отмечал Naked Science, проблемы с такими лентами давно стали буквально бичом для множества современных людей.
Изучив данные о скорости изменения температур ледяных спутников пятой и шестой планеты системы, астрономы обнаружили, что она слишком высока для по-настоящему ледяной поверхности. Оказалось, что эти тела покрыты материалом, по своим свойствам резко отличающимся от земного льда.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Черные дыры, возможно, не такие «сломанные» объекты, как считалось полвека. Автор нового исследования показал, что даже в рамках Общей теории относительности черная дыра может избежать сингулярности — точки, где законы физики перестают работать. Если он прав, новая теория гравитации для «спасения» физики внутри космических «монстров» не понадобится.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Провинция Цзянсу была процветающим центром медицинской практики в Китае во времена династии Мин (1368-1644 годы нашей эры). Микроскопический анализ крошечных частиц на поверхности хирургических ножниц и пинцета из гробницы китайского врача помог выявить следы вещества, получаемого из ядовитого растения, которое, по мнению исследователей, применялось как местная анестезия во время операций.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии