Алгоритмы машинного обучения научились предсказывать бестселлеры на Amazon
Алгоритмы машинного обучения, основанные на анализе читательского поведения, могут предугадать, какая книга станет бестселлером на Amazon спустя 15 дней после публикации.
Исследователи из Северо-Западного университета, исследовательского подразделения Microsoft в Индии и Индийского технологического института в Харагпуре разработали модель, способную предсказать успешность какой-либо книги на крупнейшем торговом интернет-сервисе Amazon, проанализировав поведение читателей на платформе Goodreads. Препринт работы размещен на arXiv.org.
Методы машинного обучения часто применяют для прогнозирования каких-либо процессов. В сущности, это класс методов искусственного интеллекта: особенность таких алгоритмов в том, что они обучаются в процессе решения большого количества задач. В случае с работой по предсказанию того, какая книга станет бестселлером, алгоритмы используют обучение по прецедентам, то есть особенностям читательского поведения.
Авторы отмечают, что популярность книги зависит от множества факторов и может быть измерена с использованием нескольких параметров. Но в конкретном исследовании они сосредоточились на том, каким книгам читатели чаще всего отдают предпочтение и как вообще их читают. Поэтому исследователи взяли необходимые данные с платформы Goodreads и попытались связать их с объемом продаж книг на Amazon.
Сначала разработчики проанализировали коллективное поведение пользователей на Goodreads. Затем они определили характерные особенности произведений, ставших бестселлерами. При этом исследователи заметили, что рейтинги и обзоры книг на Goodreads не так эффективны в прогнозировании по сравнению с данными о статусе прочтения книги каждым отдельным пользователем. На платформе Goodreads эти данные отслеживать особенно легко, так как там читатели делятся информацией о том, сколько страниц произведения ими уже прочитано, комментируют книгу и так далее. После сбора данных и их анализа исследователи разработали модель для прогнозирования успешности книги, используя методы машинного обучения.
Модель достигла точности в 88,72 процента. Это на 16,4 процента выше, чем у базовых методов, учитывающих только традиционные показатели популярности, такие как рейтинги книг или обзоры.
В прошлом году разработчики создали программу «Шелли», которая при помощи методов искусственного интеллекта «сочиняет» страшные истории. Для обучения алгоритма использовали более 140 тысяч ужастиков.
Паразитические организмы иногда не учитывают, что сами могут оказаться целью паразита более высокого уровня. Сосредотачивая все свои силы на инфицировании и размножении, они остаются беззащитными перед агрессивным специализированным нахлебником.
Планетологи обнаружили на поверхностях Титана и Плутона схожую полосу поглощения, которая не совпадает со спектрами известных льдов или органических соединений. Этот загадочный «провал» может указывать на то, что на двух очень разных ледяных мирах Солнечной системы существует общий, пока неизвестный науке класс химических веществ, поглощающий свет, который формируется под действием экстремального холода и космической радиации.
В нижних и верхних слоях Урана астрономы впервые зарегистрировали угарный газ и циановодород. Новые данные указали на то, что недра планеты могут быть значительно обогащены кислородом. Это открытие поможет разрешить давнюю загадку о том, сформировался ли Уран иначе, чем его ближайший сосед Нептун, или их образование шло по схожему сценарию.
Паразитические организмы иногда не учитывают, что сами могут оказаться целью паразита более высокого уровня. Сосредотачивая все свои силы на инфицировании и размножении, они остаются беззащитными перед агрессивным специализированным нахлебником.
Интригующие испытания высотного ракетного двигателя Raptor Vacuum для корабля Starship, верхней ступени сверхракеты Илона Маска, парадоксальны. Его работа на уровне моря уже сама по себе загадка. Ведь, по классическим представлениям, высотные двигатели на уровне моря корректно не работают. А сопло RaptorVAC на наземном стенде извергает реактивную струю без всяких признаков нарушения работы. Как такое может быть?
Американские ученые обнаружили в Гранд-Каньоне масштабную сеть скрытых пещер и изучили подземную гидросистему, которая снабжает водой весь национальный парк. Им удалось выяснить, как именно талая вода с поверхности путешествует по этим лабиринтам. Это открытие раскрыло глаза на то, как устроено знаменитое природное чудо, и поможет защитить его от засухи и загрязнений. Ранее этот механизм оставался для исследователей неизученным.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии