В НИУ ВШЭ узнали, как зарабатывать на новостях
Ученые из НИУ ВШЭ — Санкт-Петербург и ВТБ разработали первый для российского рынка алгоритм, позволяющий предсказывать колебания котировок акций на основе анализа новостного потока STTM (Stock Tonal Topic Modeling). Благодаря новой разработке инвесторы смогут строить более эффективные финансовые стратегии: алгоритм позволяет делать прогнозы в пределах месяца.
Результаты работы опубликованы в журнале PeerJ Computer Science. Можно ли предсказать рост или падение акций на фондовом рынке? Согласно одной из основных инвестиционных теорий, гипотезе эффективного рынка, акции торгуются на бирже по справедливой стоимости, в которой уже учтена вся доступная общественности информация, способная повлиять на котировки. Поэтому анализ этой информации и основанные на ней прогнозы не могут служить базой для построения эффективной инвестиционной стратегии.
Однако инвесторы не оставляли попыток угадать изменения котировок акций на бирже. Для этого использовались различные подходы, которые можно разделить на две основные группы: прогнозы на основе прошлых котировок акций и прогнозы на основе анализа внешних источников информации, таких как финансовые отчеты, новости, мнение аналитиков. Но общепринятого алгоритма для предсказания поведения акций на бирже с учетом новостного потока не существовало.
Ученые из НИУ ВШЭ — Санкт-Петербург и ВТБ разработали новый метод для прогнозирования колебаний котировок акций на основе анализа новостей — STTM (Stock Tonal Topic Modeling). Особенность метода в том, что он использует сразу два источника данных: изменение цены акций во времени и новостные статьи, а также алгоритмы тематического моделирования и определения тональности, что позволяет делать более точные прогнозы. Это первая модель, разработанная специально для российского финансового рынка.

Алгоритм STTM собирает новости из крупнейших российских СМИ, пишущих о бизнесе, финансах, политике («Коммерсантъ», «Ведомости», РИА «Новости»), затем сортирует эти новости по темам (например, спорт, политика, экономика, бизнес). Сортировка происходит на основе алгоритмов тематического моделирования (LDA и DTM). В тематических блоках выделяются ключевые слова и их тональность: позитивная, негативная, нейтральная. Метод STTM также отслеживает изменение котировок акций российских компаний во времени, например за прошедшую неделю. Сочетание этих факторов — колебание цены во времени, тематическое моделирование и тональность новостей — позволяет рассчитать коэффициент STTM. Если он больше единицы, то акции вырастут в цене, если меньше — упадут.
В рамках исследования было проанализировано более 197 тысяч экономических статей из российских СМИ и использованы данные котировок наиболее ликвидных акций российских компаний за восемь лет, с 2013 по 2021 год. Эффективность метода STTM проверялась с помощью теста на причинность по Грейнджеру: авторы исследования изучали причинно-следственную связь между новостным потоком, разбитым на темы, и колебаниями котировок акций. Кроме того, на основании полученных прогнозов моделировалась возможная инвестиционная стратегия, эффективность которой оценивалась по коэффициенту Шарпа — показателю эффективности инвестиционного портфеля.
Исследователи отмечают, что разработанный метод позволяет довольно точно предсказывать колебания цен на фондовом рынке и превосходит 26 существующих моделей по индексу Шарпа. «Мы не первые придумали анализировать новости для предсказания котировок, но мы впервые использовали эту модель для российского рынка. И мы впервые использовали тематическое моделирование и тональность для предсказания поведения акций на бирже с учетом множества тем. Наша модель хороша тем, что ее можно настроить под свои потребности: выбрать интересующие СМИ, нужный временной интервал, алгоритм тематического моделирования, даже язык», — рассказывает один из авторов исследования Сергей Кольцов, ведущий научный сотрудник Лаборатории социальной и когнитивной информатики НИУ ВШЭ — Санкт-Петербург. Алгоритм STTM позволяет делать недельные прогнозы, а код лежит в открытом доступе на Zenodo.
Дистанционное зондирование из космоса выявило 280 гигантских каменных кругов, разбросанных по пустыне Атбай в Судане. Исследователи пришли к выводу, что это погребальные сооружения, оставленные исчезнувшей культурой скотоводов. Эти люди пасли здесь стада в четвертом-третьем тысячелетии до нашей эры, когда климат в пустыне был более влажным.
Авторы нового исследования выяснили, почему летающие насекомые так не любят чеснок: в нем содержится органическое вещество, подавляющее процесс спаривания и откладывания яиц. Причем мух и комаров отпугивает не запах, а вкус чеснока, поскольку это соединение особым образом воздействует на вкусовые рецепторы.
Одни из самых таинственных явлений во Вселенной — мощные голубые вспышки — появляются внезапно, сияют почти как целые галактики и исчезают за считаные дни. Теперь астрономы, похоже, впервые приблизились к разгадке их происхождения: такие события могут возникать при слиянии нейтронной звезды или черной дыры с массивной звездой Вольфа — Райе.
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.
Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
