• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
26.09.2018, 16:22
Редакция Naked Science
481

Алгоритмы машинного обучения научились предсказывать бестселлеры на Amazon

Алгоритмы машинного обучения, основанные на анализе читательского поведения, могут предугадать, какая книга станет бестселлером на Amazon спустя 15 дней после публикации.

1_final_wtext
©Wikipedia / Автор: Дмитрий Жуков

Исследователи из Северо-Западного университета, исследовательского подразделения Microsoft в Индии и Индийского технологического института в Харагпуре разработали модель, способную предсказать успешность какой-либо книги на крупнейшем торговом интернет-сервисе Amazon, проанализировав поведение читателей на платформе Goodreads. Препринт работы размещен на arXiv.org.

 

Методы машинного обучения часто применяют для прогнозирования каких-либо процессов. В сущности, это класс методов искусственного интеллекта: особенность таких алгоритмов в том, что они обучаются в процессе решения большого количества задач. В случае с работой по предсказанию того, какая книга станет бестселлером, алгоритмы используют обучение по прецедентам, то есть особенностям читательского поведения.

 

Авторы отмечают, что популярность книги зависит от множества факторов и может быть измерена с использованием нескольких параметров. Но в конкретном исследовании они сосредоточились на том, каким книгам читатели чаще всего отдают предпочтение и как вообще их читают. Поэтому исследователи взяли необходимые данные с платформы Goodreads и попытались связать их с объемом продаж книг на Amazon.

 

Сначала разработчики проанализировали коллективное поведение пользователей на Goodreads. Затем они определили характерные особенности произведений, ставших бестселлерами. При этом исследователи заметили, что рейтинги и обзоры книг на Goodreads не так эффективны в прогнозировании по сравнению с данными о статусе прочтения книги каждым отдельным пользователем. На платформе Goodreads эти данные отслеживать особенно легко, так как там читатели делятся информацией о том, сколько страниц произведения ими уже прочитано, комментируют книгу и так далее. После сбора данных и их анализа исследователи разработали модель для прогнозирования успешности книги, используя методы машинного обучения.

 

Модель достигла точности в 88,72 процента. Это на 16,4 процента выше, чем у базовых методов, учитывающих только традиционные показатели популярности, такие как рейтинги книг или обзоры.

 

В прошлом году разработчики создали программу «Шелли», которая при помощи методов искусственного интеллекта «сочиняет» страшные истории. Для обучения алгоритма использовали более 140 тысяч ужастиков.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
23 апреля, 18:34
Александр Березин

В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.

23 апреля, 12:08
Любовь С.

Астроциты — клетки, которые долго считались лишь «помощниками» нейронов — оказались частью скрытой системы связи в мозге. Они, как показали результаты нового исследования, формируют собственные протяженные сети, соединяющие разные части головного мозга. Это открытие меняет представление о том, как мозг координирует свою работу, адаптируется к новым условиям и восстанавливается после повреждений.

21 апреля, 20:03
Evgenia Vavilova

Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.

23 апреля, 18:34
Александр Березин

В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.

21 апреля, 20:03
Evgenia Vavilova

Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.

20 апреля, 13:29
Илья Гриднев

Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.

5 апреля, 15:48
Александр Березин

Четыре человека, летящие к Луне, столкнулись с целым рядом мелких неприятностей — от низкой температуры в начале работы до поломки мочевыводящей системы туалета на вторые сутки и необходимости взамен пользоваться пакетами. К счастью, пока самые крупные сложности удалось компенсировать. Но все они вместе могут сдвинуть ситуацию к решению, о котором Naked Science уже говорил в нашем видеоподкасте о миссии: не исключено, что при высадке астронавтов на Луне их корабль состыкуют со Starship не на окололунной, а уже на околоземной орбите.

10 апреля, 10:51
Татьяна Зайцева

Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.

9 апреля, 08:30
Максим Абдулаев

Окаменелые остатки рептилии возрастом 289 миллионов лет сохранили полное анатомическое устройство грудной клетки ранних покорителей суши. Благодаря нетронутым хрящам исследователи реконструировали механику первого полноценного реберного дыхания. Наличие в тканях оригинальных белков подтвердило, что сложные органические молекулы способны сохраняться в палеонтологической летописи почти на 100 миллионов лет дольше, чем считалось.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Комментарий на проверке

Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно