В НИУ ВШЭ узнали, как зарабатывать на новостях
Ученые из НИУ ВШЭ — Санкт-Петербург и ВТБ разработали первый для российского рынка алгоритм, позволяющий предсказывать колебания котировок акций на основе анализа новостного потока STTM (Stock Tonal Topic Modeling). Благодаря новой разработке инвесторы смогут строить более эффективные финансовые стратегии: алгоритм позволяет делать прогнозы в пределах месяца.
Результаты работы опубликованы в журнале PeerJ Computer Science. Можно ли предсказать рост или падение акций на фондовом рынке? Согласно одной из основных инвестиционных теорий, гипотезе эффективного рынка, акции торгуются на бирже по справедливой стоимости, в которой уже учтена вся доступная общественности информация, способная повлиять на котировки. Поэтому анализ этой информации и основанные на ней прогнозы не могут служить базой для построения эффективной инвестиционной стратегии.
Однако инвесторы не оставляли попыток угадать изменения котировок акций на бирже. Для этого использовались различные подходы, которые можно разделить на две основные группы: прогнозы на основе прошлых котировок акций и прогнозы на основе анализа внешних источников информации, таких как финансовые отчеты, новости, мнение аналитиков. Но общепринятого алгоритма для предсказания поведения акций на бирже с учетом новостного потока не существовало.
Ученые из НИУ ВШЭ — Санкт-Петербург и ВТБ разработали новый метод для прогнозирования колебаний котировок акций на основе анализа новостей — STTM (Stock Tonal Topic Modeling). Особенность метода в том, что он использует сразу два источника данных: изменение цены акций во времени и новостные статьи, а также алгоритмы тематического моделирования и определения тональности, что позволяет делать более точные прогнозы. Это первая модель, разработанная специально для российского финансового рынка.

Алгоритм STTM собирает новости из крупнейших российских СМИ, пишущих о бизнесе, финансах, политике («Коммерсантъ», «Ведомости», РИА «Новости»), затем сортирует эти новости по темам (например, спорт, политика, экономика, бизнес). Сортировка происходит на основе алгоритмов тематического моделирования (LDA и DTM). В тематических блоках выделяются ключевые слова и их тональность: позитивная, негативная, нейтральная. Метод STTM также отслеживает изменение котировок акций российских компаний во времени, например за прошедшую неделю. Сочетание этих факторов — колебание цены во времени, тематическое моделирование и тональность новостей — позволяет рассчитать коэффициент STTM. Если он больше единицы, то акции вырастут в цене, если меньше — упадут.
В рамках исследования было проанализировано более 197 тысяч экономических статей из российских СМИ и использованы данные котировок наиболее ликвидных акций российских компаний за восемь лет, с 2013 по 2021 год. Эффективность метода STTM проверялась с помощью теста на причинность по Грейнджеру: авторы исследования изучали причинно-следственную связь между новостным потоком, разбитым на темы, и колебаниями котировок акций. Кроме того, на основании полученных прогнозов моделировалась возможная инвестиционная стратегия, эффективность которой оценивалась по коэффициенту Шарпа — показателю эффективности инвестиционного портфеля.
Исследователи отмечают, что разработанный метод позволяет довольно точно предсказывать колебания цен на фондовом рынке и превосходит 26 существующих моделей по индексу Шарпа. «Мы не первые придумали анализировать новости для предсказания котировок, но мы впервые использовали эту модель для российского рынка. И мы впервые использовали тематическое моделирование и тональность для предсказания поведения акций на бирже с учетом множества тем. Наша модель хороша тем, что ее можно настроить под свои потребности: выбрать интересующие СМИ, нужный временной интервал, алгоритм тематического моделирования, даже язык», — рассказывает один из авторов исследования Сергей Кольцов, ведущий научный сотрудник Лаборатории социальной и когнитивной информатики НИУ ВШЭ — Санкт-Петербург. Алгоритм STTM позволяет делать недельные прогнозы, а код лежит в открытом доступе на Zenodo.
Изучив данные о скорости изменения температур ледяных спутников пятой и шестой планеты системы, астрономы обнаружили, что она слишком высока для по-настоящему ледяной поверхности. Оказалось, что эти тела покрыты материалом, по своим свойствам резко отличающимся от земного льда.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Черные дыры, возможно, не такие «сломанные» объекты, как считалось полвека. Автор нового исследования показал, что даже в рамках Общей теории относительности черная дыра может избежать сингулярности — точки, где законы физики перестают работать. Если он прав, новая теория гравитации для «спасения» физики внутри космических «монстров» не понадобится.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вначале Reuters опубликовал статью о взаимоотношениях SpaceX и Пентагона, которую миллиардер --- традиционно для его отношений с этим изданием — назвал фейком. Опровергая ее тезисы, он обнародовал информацию, не представленную ранее публично.
Провинция Цзянсу была процветающим центром медицинской практики в Китае во времена династии Мин (1368-1644 годы нашей эры). Микроскопический анализ крошечных частиц на поверхности хирургических ножниц и пинцета из гробницы китайского врача помог выявить следы вещества, получаемого из ядовитого растения, которое, по мнению исследователей, применялось как местная анестезия во время операций.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
