Алгоритмы машинного обучения научились предсказывать бестселлеры на Amazon
4 минуты
Редакция

Алгоритмы машинного обучения научились предсказывать бестселлеры на Amazon

Алгоритмы машинного обучения, основанные на анализе читательского поведения, могут предугадать, какая книга станет бестселлером на Amazon спустя 15 дней после публикации.

1_final_wtext

Исследователи из Северо-Западного университета, исследовательского подразделения Microsoft в Индии и Индийского технологического института в Харагпуре разработали модель, способную предсказать успешность какой-либо книги на крупнейшем торговом интернет-сервисе Amazon, проанализировав поведение читателей на платформе Goodreads. Препринт работы размещен на arXiv.org.

 

Методы машинного обучения часто применяют для прогнозирования каких-либо процессов. В сущности, это класс методов искусственного интеллекта: особенность таких алгоритмов в том, что они обучаются в процессе решения большого количества задач. В случае с работой по предсказанию того, какая книга станет бестселлером, алгоритмы используют обучение по прецедентам, то есть особенностям читательского поведения.

 

Авторы отмечают, что популярность книги зависит от множества факторов и может быть измерена с использованием нескольких параметров. Но в конкретном исследовании они сосредоточились на том, каким книгам читатели чаще всего отдают предпочтение и как вообще их читают. Поэтому исследователи взяли необходимые данные с платформы Goodreads и попытались связать их с объемом продаж книг на Amazon.

 

Сначала разработчики проанализировали коллективное поведение пользователей на Goodreads. Затем они определили характерные особенности произведений, ставших бестселлерами. При этом исследователи заметили, что рейтинги и обзоры книг на Goodreads не так эффективны в прогнозировании по сравнению с данными о статусе прочтения книги каждым отдельным пользователем. На платформе Goodreads эти данные отслеживать особенно легко, так как там читатели делятся информацией о том, сколько страниц произведения ими уже прочитано, комментируют книгу и так далее. После сбора данных и их анализа исследователи разработали модель для прогнозирования успешности книги, используя методы машинного обучения.

 

Модель достигла точности в 88,72 процента. Это на 16,4 процента выше, чем у базовых методов, учитывающих только традиционные показатели популярности, такие как рейтинги книг или обзоры.

 

В прошлом году разработчики создали программу «Шелли», которая при помощи методов искусственного интеллекта «сочиняет» страшные истории. Для обучения алгоритма использовали более 140 тысяч ужастиков.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
7 апреля
9 минут
Мария Азарова

Ученые провели эксперимент с участием нескольких больных коронавирусом. Исследование показало, что при кашле вирусные частицы способны попадать в окружающую среду, даже если инфицированный носит медицинскую маску. При этом их большее количество было обнаружено на внешней стороне изделия, а не на внутренней.

Позавчера, 16:15
7 минут
Мария Азарова

Эксперимент показал, что прослушивание произведений известных композиторов во время лекций по микроэкономике и ночного сна повысило шансы учащихся на успешное прохождение теста.

7 апреля
5 минут
София Жаботинская

Воздействие наноструктур поверхностей крылышек на бактерии оказалось сложнее, чем ранее считали ученые, и может помочь изготовить биомедицинские изделия, одновременно работающие против инфекции и на приживаемость.

7 апреля
5 минут
Сергей Васильев

Сверхточные эксперименты позволили оценить гравитацию на дистанциях менее 50 микрометров и не обнаружили никаких следов свернутых измерений Вселенной.

6 апреля
8 минут
София Жаботинская

Новое исследование показало группы риска при Covid-19, а также предположило, какие признаки могут служить предвестниками неблагоприятного прогноза на основе систематизации смертельных случаев.

4 апреля
26 минут
Александр Березин

В России обещают начать тестирование вакцины в середине лета. В США намереваются выпустить ее в середине следующего лета, а в Китае уже тестируют. При этом ряд специалистов утверждает, что создать ее вообще не получится в обозримые сроки. Откуда такой разнобой мнений? Будет ли она создана на самом деле, и если да, то в какие сроки?

10 марта
5 минут
Сергей Васильев

Новый анализ образцов лунного грунта показал, что под поверхностью спутника могут скрываться остатки древней планеты Тейя, столкновение которой с Землей и привело к появлению спутника.

10 марта
2 минуты
Илья Ведмеденко

Принадлежащие норвежским ВВС американские истребители пятого поколения использовали для перехвата российских боевых самолетов — Ту-142 и МиГ-31.

13 марта
38 минут
Александр Березин

С начала марта 2020 года по социальным сетям распространяется одна и та же мысль: в России полным-полно больных Covid-19, просто власти занижают медицинскую статистику «на много порядков». Больные гриппом и ОРВИ, считают сторонники этой точки зрения, на самом деле, страдают от коронавируса. Смерти от него тоже «оформят» под грипп и обычную пневмонию. Более того, сходными фальсификациями пытаются объяснить и почти полную победу над эпидемией в Китае. Версия, согласимся, красочная, будоражит воображение. Проверим, совместима ли она с реальностью.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Лучшие материалы
Предстоящие мероприятия
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: