Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В НИУ ВШЭ проанализировали индекс счастья россиян в социальных сетях
Исследователи из Высшей школы бизнеса НИУ ВШЭ научили модель определять субъективное благополучие человека в социальной сети. На основе анализа 10 миллионов твитов был составлен рейтинг праздников россиян: самым популярным в русскоязычном Twitter оказался Новый год, также пользователи с радостью отмечают День защитника Отечества, Международный женский день и Хэллоуин.
Результаты работы опубликованы в журнале PeerJ Computer Science. Социальные сети стали одним из основных средств общения, обмена информацией и мнений, что делает их важным источником данных для исследователей. Особенность такого использования социальных сетей — возможность отслеживания эмоций людей в режиме реального времени.
Своевременное понимание настроений населения, определяемых также как степень субъективного благополучия, может рассматриваться в качестве важного ориентира развития государства вместо используемых сегодня показателей, таких как валовой внутренний продукт.
Исследователи из Высшей школы бизнеса НИУ ВШЭ рассчитали индексы наблюдаемого субъективного благополучия для русскоязычного сегмента социальной сети Twitter*. В отличие от индекса субъективного благополучия, данные для которого собирают социологические центры (например, ВЦИОМ) на основе опросов, такой механизм фиксирует благополучие пользователя без прямого контакта с ним.
В качестве источника данных о твитах на русском языке исследователи взяли Twitter Stream Grab. Это общедоступная хронологическая коллекция JSON, полученная из общего потока Twitter «Spritzer» API. Согласно Twitter, этот API предоставляет один процент выборки полных общедоступных твитов и не привязан к конкретным темам. Поэтому, по мнению исследователей, его можно считать хорошим и репрезентативным источником твитов на широкий круг тем.
Для обучения модели машинного обучения был выбран крупнейший датасет твитов общего назначения на русском языке — RuSentiTweet. Это самый большой набор данных твитов с ручной аннотацией для анализа тональности. RuSentiTweet состоит из 13 392 твитов, сгруппированных в пять классов: позитивные, нейтральные, негативные, твиты, содержащие речевые акты и поздравления, и твиты, не выражающие четкого настроения или отношения к чему-либо.
Исследователи применили модель на 10 869 003 твитах в России, опубликованных 1 955 827 уникальными пользователями за 20 месяцев (в среднем 5,55 твита на пользователя). На основе полученных данных ученые составили рейтинг популярности праздников у пользователей социальной сети. Ожидаемо самым популярным праздником в русскоязычном Twitter оказался Новый год. Доля поздравлений 31 декабря превышает среднегодовое значение более чем в три раза и достигает 12,3 процента всех твитов за этот день. День защитника Отечества и Международный женский день занимают второе и третье место соответственно.
Хэллоуин в русскоязычном Twitter — один из самых популярных зарубежных праздников. Он занял девятое место среди всех праздников и обогнал, например, День России и 1 Мая. Этот вывод отличается от результатов опроса ВЦИОМ. Исследователи предполагают, что это связано с тем, что в Twitter доминирует младшая возрастная группа, более склонная к празднованию Хэллоуина, тогда как опрос ВЦИОМ дает репрезентативную выборку всего населения России.
Принимая во внимание, что есть также данные, утверждающие, что люди разного пола могут по-разному относиться к разным праздникам, был рассчитан рейтинг праздников для каждого пола отдельно.
«По всем рассматриваемым праздникам доля твитов с поздравлениями от женщин была выше, чем от мужчин, за исключением одного праздника — Дня космонавтики. Женщины чаще пишут поздравления и используют речевые акты не только на праздники, но и в целом», — добавляет аспирант Высшей школы бизнеса НИУ ВШЭ Сергей Сметанин.
Исследователи отмечают, что русскоязычные твиты от Twitter Stream Grab могут быть использованы только как дополнительная информация к традиционному опросному показателю субъективного благополучия населения, но не как основной источник информации. Во-первых, при анализе также учитывались твиты русскоязычных пользователей, не проживающих в России. У них может быть другой уровень субъективного благополучия, что может влиять на показатели исследования в ту или иную сторону. Во-вторых, старшие возрастные группы в исследовании были недостаточно представлены, поскольку Twitter наиболее популярен у молодой аудитории.
«Полученные результаты наблюдаемого субъективного благополучия сравнивались с индексом счастья ВЦИОМ. Нам удалось получить статистически значимую корреляцию. Исходя из этого, мы предполагаем, что при доступе к большему объему данных возможно получить еще более сильную корреляцию и потенциально доказать, что социальные сети могут использоваться сами по себе как надежный источник данных наблюдаемого субъективного благополучия населения», — отмечает Сергей Сметанин.
*Twitter — социальная сеть Twitter заблокирована на территории России по решению Генпрокуратуры.
Американские ученые проанализировали данные о поедании фекалий животными, чтобы выяснить, какие причины стоят за этим поведением и какие закономерности можно проследить. В результате они разделили всю выборку более чем из 150 видов на семь категорий по тому, что заставляет зверей питаться таким сомнительным продуктом.
Работать под началом шефа-абьюзера тяжело, но свежее исследование показало, что бывают варианты похуже. Ученые выяснили, что еще негативнее на моральный дух и производительность труда сотрудников влияет, когда во главе команды стоит самодур, у которого вспышки агрессии непредсказуемо сменяются этичным поведением.
Несмотря на отмену попытки «экономичной» ловли первой ступени, шестой испытательный полет Starship был успешным. Корабль — вторая ступень системы впервые продемонстрировала возможность маневра на орбите. Первая ступень после приводнения неожиданно для всех смогла пережить два взрыва, не утратив плавучесть. Среди наблюдавших за испытанием был Дональд Трамп.
Международная коллаборация физиков под руководством ученых из Йельского университета в США представила самые убедительные на сегодня подтверждения существования нового типа сверхпроводящих материалов. Доказательство существования нематической фазы вещества — научный прорыв, открывающий путь к созданию сверхпроводимости совершенно новым способом.
Принято считать, что естественный спутник Земли возник в результате ее столкновения с другой планетой, но к этой версии есть вопросы. Теперь ученые предложили рассмотреть сценарий возможного захвата Луны притяжением Земли из пролетавшей мимо двойной системы.
Ученые из Аргентины в серии экспериментов проследили за поведением домашних собак во время разногласий между членами семьи и выявили у четвероногих питомцев ряд характерных реакций на конфликт.
Под рыжим верхним слоем с виду обычного камня открылся целый калейдоскоп довольно неожиданных оттенков. Это особенно интересно с учетом того, где лежит камень — в марсианском кратере, который по всем признакам когда-то был озером.
Международная коллаборация физиков под руководством ученых из Йельского университета в США представила самые убедительные на сегодня подтверждения существования нового типа сверхпроводящих материалов. Доказательство существования нематической фазы вещества — научный прорыв, открывающий путь к созданию сверхпроводимости совершенно новым способом.
Органические молекулы с пи-связью образуют очень устойчивые геометрии, которые не любят нарушаться. В 1924 году немецкий химик Юлиус Бредт сформулировал соответствующий запрет, вошедший в учебники химии. Тем не менее это в некоторых случаях возможно. В новой работе американские исследователи представили несколько «антибредтовских» соединений из класса олефинов.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
ПонятноМы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.
Понятно
Комментарии