Алгоритмы машинного обучения научились предсказывать бестселлеры на Amazon — Naked Science
26.09.2018
Редакция

Алгоритмы машинного обучения научились предсказывать бестселлеры на Amazon

Алгоритмы машинного обучения, основанные на анализе читательского поведения, могут предугадать, какая книга станет бестселлером на Amazon спустя 15 дней после публикации.

1_final_wtext
©Wikipedia

Исследователи из Северо-Западного университета, исследовательского подразделения Microsoft в Индии и Индийского технологического института в Харагпуре разработали модель, способную предсказать успешность какой-либо книги на крупнейшем торговом интернет-сервисе Amazon, проанализировав поведение читателей на платформе Goodreads. Препринт работы размещен на arXiv.org.

 

Методы машинного обучения часто применяют для прогнозирования каких-либо процессов. В сущности, это класс методов искусственного интеллекта: особенность таких алгоритмов в том, что они обучаются в процессе решения большого количества задач. В случае с работой по предсказанию того, какая книга станет бестселлером, алгоритмы используют обучение по прецедентам, то есть особенностям читательского поведения.

 

Авторы отмечают, что популярность книги зависит от множества факторов и может быть измерена с использованием нескольких параметров. Но в конкретном исследовании они сосредоточились на том, каким книгам читатели чаще всего отдают предпочтение и как вообще их читают. Поэтому исследователи взяли необходимые данные с платформы Goodreads и попытались связать их с объемом продаж книг на Amazon.

 

Сначала разработчики проанализировали коллективное поведение пользователей на Goodreads. Затем они определили характерные особенности произведений, ставших бестселлерами. При этом исследователи заметили, что рейтинги и обзоры книг на Goodreads не так эффективны в прогнозировании по сравнению с данными о статусе прочтения книги каждым отдельным пользователем. На платформе Goodreads эти данные отслеживать особенно легко, так как там читатели делятся информацией о том, сколько страниц произведения ими уже прочитано, комментируют книгу и так далее. После сбора данных и их анализа исследователи разработали модель для прогнозирования успешности книги, используя методы машинного обучения.

 

Модель достигла точности в 88,72 процента. Это на 16,4 процента выше, чем у базовых методов, учитывающих только традиционные показатели популярности, такие как рейтинги книг или обзоры.

 

В прошлом году разработчики создали программу «Шелли», которая при помощи методов искусственного интеллекта «сочиняет» страшные истории. Для обучения алгоритма использовали более 140 тысяч ужастиков.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
30 июля
Мария Азарова

Генеральный конструктор «Энергии» и руководитель полета российского сегмента МКС Владимир Соловьев назвал причину незапланированного включения двигателей нового модуля «Наука», из-за которого станцию развернуло на 45 градусов.

4 часа назад
Александр Березин

СМИ всего мира принялись рассказывать, что новые штаммы возникли из-за ослабления ограничений, снятия масок, а то и под воздействием вакцин. Якобы те оказали эволюционное давление, заставляющее вирус обходить вакцинную защиту. Увы, реальная биология указывает на совсем иную — и более устрашающую — картину. Разбираемся в деталях.

30 июля
Сколтех

Исследователи Сколтеха и их коллеги изучили самый продолжительный на сегодня случай заболевания Covid-19 у пациентки с ослабленным иммунитетом, которая болела 318 дней. Исследование позволило выявить мутации, которые помогают коронавирусу SARS-CoV-2 избегать клеточного иммунитета.

27 июля
Сергей Васильев

Окаменелости возрастом более 3,4 миллиарда лет могут быть остатками микробов-архей, живших и выделявших метан у гидротермальных источников на дне ископаемого моря.

25 июля
Мария Азарова

Ученые подтвердили связь между коронавирусной инфекцией и снижением когнитивных способностей на основе анализа данных более чем 81 тысячи человек.

28 июля
Мария Азарова

Член Северо-Западной организации Федерации космонавтики России Александр Хохлов рассказал о проблемах, сопровождающих модуль «Наука» на пути к МКС, и объяснил, почему на долгожданную стыковку будет всего одна попытка.

25 июля
Александр Березин

До массовой термоядерной энергетики 20 лет — и всегда будет 20 лет. Это незатейливая шутка сама стала старой еще 20 лет назад. Общество расстраивается от того, что термояд все никак не могут вывести на промышленный уровень. И лишь Илон Маск считает, что термоядерный реактор вовсе не нужен. Внимательный анализ показывает, что он прав. Даже если все технические проблемы термоядерной энергетики чудесным образом разрешатся, у нее не будет шансов вытеснить конкурентов. Как так вышло, и что тогда спасет человечество от энергетического кризиса?

13 июля
Ольга Иванова

Международная команда ученых идентифицировала ДНК из почвы в грузинской пещере. Благодаря этому исследователям удалось восстановить геном человека возрастом 25 тысяч лет, не имея никаких скелетных останков.

8 июля
Василий Парфенов

Подросток из бельгийского города Остенде стал вторым самым юным обладателем высшего образования в обозримой истории. Он с отличием окончил курс физики в Антверпенском университете и теперь собирается защитить магистерскую степень, а затем и докторскую диссертацию в этой области. Цель у него простая и понятная: увеличение продолжительности жизни человека вплоть до полного бессмертия за счет замены частей тела и органов механическими или искусственными.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Подтвердить?
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: