• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
26.09.2018, 16:22
Редакция Naked Science
481

Алгоритмы машинного обучения научились предсказывать бестселлеры на Amazon

Алгоритмы машинного обучения, основанные на анализе читательского поведения, могут предугадать, какая книга станет бестселлером на Amazon спустя 15 дней после публикации.

1_final_wtext
©Wikipedia / Автор: Дмитрий Жуков

Исследователи из Северо-Западного университета, исследовательского подразделения Microsoft в Индии и Индийского технологического института в Харагпуре разработали модель, способную предсказать успешность какой-либо книги на крупнейшем торговом интернет-сервисе Amazon, проанализировав поведение читателей на платформе Goodreads. Препринт работы размещен на arXiv.org.

 

Методы машинного обучения часто применяют для прогнозирования каких-либо процессов. В сущности, это класс методов искусственного интеллекта: особенность таких алгоритмов в том, что они обучаются в процессе решения большого количества задач. В случае с работой по предсказанию того, какая книга станет бестселлером, алгоритмы используют обучение по прецедентам, то есть особенностям читательского поведения.

 

Авторы отмечают, что популярность книги зависит от множества факторов и может быть измерена с использованием нескольких параметров. Но в конкретном исследовании они сосредоточились на том, каким книгам читатели чаще всего отдают предпочтение и как вообще их читают. Поэтому исследователи взяли необходимые данные с платформы Goodreads и попытались связать их с объемом продаж книг на Amazon.

 

Сначала разработчики проанализировали коллективное поведение пользователей на Goodreads. Затем они определили характерные особенности произведений, ставших бестселлерами. При этом исследователи заметили, что рейтинги и обзоры книг на Goodreads не так эффективны в прогнозировании по сравнению с данными о статусе прочтения книги каждым отдельным пользователем. На платформе Goodreads эти данные отслеживать особенно легко, так как там читатели делятся информацией о том, сколько страниц произведения ими уже прочитано, комментируют книгу и так далее. После сбора данных и их анализа исследователи разработали модель для прогнозирования успешности книги, используя методы машинного обучения.

 

Модель достигла точности в 88,72 процента. Это на 16,4 процента выше, чем у базовых методов, учитывающих только традиционные показатели популярности, такие как рейтинги книг или обзоры.

 

В прошлом году разработчики создали программу «Шелли», которая при помощи методов искусственного интеллекта «сочиняет» страшные истории. Для обучения алгоритма использовали более 140 тысяч ужастиков.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
25 мая, 14:00
Андрей Серегин

В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.

23 мая, 09:55
Андрей Серегин

Больше половины студентов регулярно читают учебные тексты под музыку, хотя многие научные работы утверждают, что это вредит пониманию текста. Исследователи из Университета Эдит Коуэн выяснили, что эта привычка определяется не когнитивными способностями вроде силы внимания, а тем, насколько важную роль музыка играет в жизни конкретного человека.

25 мая, 19:02
Александр Березин

В 2020-х годах шакалы достигли Архангельской области, а еще раньше колонизировали другие регионы Северной Европы. Авторы новой работы проанализировали перспективы и пришли к выводу о неизбежности многократного расширения их европейского ареала в этом веке. Причем ключевую роль в этом играет человек и его действия.

25 мая, 14:00
Андрей Серегин

В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.

25 мая, 10:21
Александр Березин

Последние несколько лет по всему миру выходит множество работ о том, что микрочастицы искусственных полимеров накапливаются в тканях человека и могут быть небезопасны. Мы решили обратиться к академику Алексею Хохлову, чтобы дать трибуну противоположной точке зрения. Выбор между ними предлагаем сделать читателю.

21 мая, 16:54
ЮФУ

Астрофизики Южного федерального университета предложили объяснение одной из самых интригующих загадок современной физики — годичных колебаний сигнала в детекторе DAMA/LIBRA, который вот уже почти тридцать лет регистрирует странные сигналы в подземной лаборатории Гран-Сассо в Италии, интерпретируемые как взаимодействие частиц темной материи с обычным веществом.

17 мая, 10:35
Игорь Байдов

В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.

29 апреля, 13:04
Александр Березин

Релиз довольно неожиданно перенес время образования протонов и нейтронов в более раннее прошлое Вселенной. К сожалению, из его текста осталось неясным научное обоснование таких фундаментальных изменений в космологии. Также он резко передвинул в прошлое и момент возникновения реликтового излучения.

17 мая, 10:00
Evgenia Vavilova

При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Авторизуясь, вы даете согласие на обработку персональных данных и подтверждаете ознакомление с Политикой.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно