Исследователи Высшей школы бизнеса НИУ ВШЭ с помощью машинного обучения проанализировали 2,7 миллионов публичных постов в социальной сети Одноклассники. Выяснилось, что больше всего позитивных сообщений пользователи публикуют в теплую погоду и при слабом ветре.
Результаты исследования опубликованы в журнале PeerJ Comput Science. Аспирант департамента бизнес-информатики Высшей школы бизнеса НИУ ВШЭ Сергей Сметанин применил технологии автоматической обработки текстов и изучил взаимосвязь между погодными условиями и эмоциями, выраженными пользователями социальных сетей. В работе анализировались текстовые посты пользователей социальной сети Одноклассники, которую ежемесячно посещают свыше 38 миллионов пользователей в России.
Чаще всего пользователи выражали позитивное настроение при дневной температуре от +20°С до +25°С. При этом разница между максимальной и минимальной дневной температурой в 15–20°С наоборот связана с меньшей долей позитивных постов. Легкий бриз (с 5 до 11 км/ч) при этом оказался связан с выражением позитивного настроения.
Для исследования была использована база данных 2,7 млн русскоязычных публичных постов из OK. Каждый пост содержал анонимизированный идентификатор пользователя, текст, время публикации и город, в котором находился автор на момент публикации поста.
Полученные данные были обработаны с помощью модели машинного обучения для обработки естественного языка RuRoBERTA-Large-RuSentiment и классифицированы по выражаемому настроению. На основе полученных данных был рассчитан индекс наблюдаемого положительного эффекта для каждого дня и города. Далее с помощью регрессионного анализа было изучено взаимоотношение между индексом и погодными условиями.
«Влияние погодных условий на настроение людей кажется очевидным, тем не менее исследования, изучающие такую взаимосвязь, часто показывают противоречивые результаты. За последнее десятилетие благодаря распространению социальных сетей и развитию методов автоматической обработки текстов стало возможным изучить взаимосвязи между погодой и настроением пользователей в интернете. Очевидно, что бизнесу важно знать и учитывать поведение потребителей в контексте внешних факторов для формирования специальных предложений и акций», — отмечает Михаил Комаров, научный руководитель проекта, профессор департамента бизнес-информатики Высшей школы бизнеса НИУ ВШЭ.
«Это исследование стало одним из первых в этом направлении. Именно благодаря анализу публичных постов удалось проанализировать большее количество данных, что ранее было бы невозможным при традиционном опросном исследовании», — комментирует автор исследования Сергей Сметанин.