• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
06.10.2022
НИУ ВШЭ
29
2 777

В НИУ ВШЭ построили рейтинг тем, вызывающих самые токсичные онлайн-комментарии

4.7

Исследователи Высшей школы бизнеса НИУ ВШЭ создали модель, которая может автоматически выявлять токсичные комментарии, написанные на русском языке. Алгоритм определил их долю среди разных тем в социальной сети «Пикабу». Больше всего таких записей было под постами о политике, темы безопасности и социально-экономического развития заняли второе и третье места.

В НИУ ВШЭ построили рейтинг тем, вызывающих самые токсичные онлайн-комментарии / ©Getty images / Автор: Caristania Fabricius

Результаты работы опубликованы в сборнике IEEE International Conference on Business Informatics. Токсичная речь в онлайн-беседах может привести не только к негативным последствиям для психического здоровья, но и к насилию в реальном мире. Под токсичностью в интернете понимают грубый, неуважительный или необоснованный комментарий, который может заставить людей покинуть обсуждение или отказаться от того, чтобы делиться своей точкой зрения.

Ученые Высшей школы экономики изучили, какие темы вызывают наиболее острые комментарии, на примере социальной сети «Пикабу». Для этого была создана модель машинного обучения, которая способна автоматически определять токсичные комментарии на русском языке, а также разработана методология для категоризации постов по разным темам.

Исследователи отобрали корпус из 521 050 постов и 19 275 438 комментариев, размещенных в 2019 году. Для исследования были взяты темы, которые относятся к основным направлениям измерения субъективного благополучия: политика, здоровье, социально-экономическое развитие, безопасность, окружающая среда, возможности трудоустройства.

В отличие от предыдущих работ, ученые не только сосредоточились на тренировке модели, но и опробовали ее на практике. В рамках исследования была создана модель ToxicRuBERT-TPikabu, которая может автоматически определять токсичные комментарии, написанные на русском языке. Поскольку обучение подобных нейронных сетей требует значительного количества вычислительных мощностей, авторы исследования использовали суперкомпьютер НИУ ВШЭ.

«Для классификации токсичных комментариев мы вручную разметили набор данных через Yandex.Toloka и провели эксперименты по обучению классификаторов на основе языковых моделей RuBERT и ToxicRuBERT. В наших исследованиях по классификации токсичности и настроений в русскоязычных текстах эти модели демонстрировали более высокое качество классификации, чем другие», — рассказывает соавтор исследования, аспирант департамента бизнес-информатики Высшей школы бизнеса НИУ ВШЭ Сергей Сметанин.

Анализ постов «Пикабу» показал, что наибольшая доля токсичных комментариев была под постами о политике (вполне ожидаемо), темы безопасности и социально-экономического развития заняли второе и третье места, а остальные темы показали примерно одинаковые значения. «Будущие исследования могут быть связаны с изучением особенностей распространения токсичного контента. Некоторые исследования уже показывают, что такой стиль может быть заразным: грубость и неуважение к собеседнику со стороны одного пользователя приводят к тому, что и другие пользователи отвечают в схожем ключе», — рассказывает Сергей Сметанин. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Позавчера, 17:49
Адель Романенкова

Красный сверхгигант Бетельгейзе в созвездии Ориона больше всего известен признаками «скорого» взрыва сверхновой, но недавно к этому добавились новые подозрения: о том, что она может быть двойной. Теперь астрономы пытаются выяснить, что представляет собой ее напарник. Недавние наблюдения привели к выводу, что это явно не белый карлик и не нейтронная звезда. Предполагают, что на самом деле это протозвезда.

Вчера, 10:02
Юлия Трепалина

Ученые отследили происхождение грибка Pseudogymnoascus destructans — возбудителя «синдрома белого носа», который за последние десятилетия едва не истребил некоторые виды летучих мышей в США и Канаде. Также специалисты предупредили о ранее неизвестной генетической разновидности патогена, которая грозит североамериканским рукокрылым новыми вспышками заболевания.

Вчера, 10:53
Полина Меньшова

Мурлыканье кошек оказалось связано с типом гена андрогенового рецептора. Закономерности, объясняющие поведение домашних питомцев, обнаружили ученые из Японии.

26 мая
Unitsky String Technologies Inc.

Казахстанский Алматы — город контрастов, где горы соседствуют с урбанистическими пейзажами, а бизнес-центры — с историческими кварталами. Неизменным остается одно — пробки. Ежедневно сюда приезжает более 700 тысяч автомобилей из пригородов, при этом в самом мегаполисе зарегистрировано порядка 600 тысяч транспортных средств. В результате по улицам ежедневно движется более миллиона транспортных средств.

27 мая
НИУ ВШЭ

Исследователи ВШЭ выделили более 4000 примеров устной русской речи билингвов из семи регионов России и выяснили: большинство нестандартных форм в конструкциях с числительными связано не только с их родным языком, но и с тем, как часто выражение встречается в повседневной речи. Например, фразы «два часа» или «пять километров» почти всегда совпадают с литературным вариантом, а вот менее привычные выражения, особенно с числительными от двух до четырех, а также с собирательными формами вроде «двое» или «трое», часто звучат иначе.

27 мая
Любовь Соковикова

Хотя попытки объединить квантовую теорию и гравитацию десятилетиями терпели неудачу, ученые продолжают выдвигать новые, порой крайне спорные гипотезы. Авторы нового исследования, например, предложили посмотреть на гравитацию так же, как на другие фундаментальные силы природы — через симметрии и поля.

6 мая
Редакция Naked Science

Да, с волосами и люком все так. У космонавта Суниты Уильямс волосы на МКС плавали свободно, а у Кэти Пэрри и прочих в полете 14 апреля 2025 года — нет. Но это не значит, что суборбитального космического полета первого чисто женского экипажа не было или что он был инсценировкой. Причем, в общем-то, чтобы понять это, даже не нужно обладать специальными знаниями.

22 мая
ПНИПУ

Недавно вышел второй сезон сериала «Одни из нас» (TheLastofUs), созданного по сюжету популярнейшей видеоигры. Ученые Пермского Политеха решили разобраться, насколько реален сценарий грибной пандемии, превращающей людей зомби? Чем живет кордицепс и как он «ищет» своих жертв, действительно ли паразит способен эволюционировать настолько, чтобы поражать человеческий организм и подчинять себе его волю, был бы у людей шанс выжить, какие грибы уже поселились в наших телах и выручит ли нас иммунитет, сформированный тысячелетиями.

6 мая
Александр Березин

Мощнейшее отключение электроэнергии за последние 20 лет истории Европы случилось уже неделю назад, а испанские власти пока так и не объявили о его причинах. Это логично: как мы покажем ниже, ответ на вопрос, кто виноват, получится очень неполиткорректным. И, более того, противоречащим линии правящей в Испании партии. Но мы живем за тысячи километров от нее, поэтому можем себе позволить аполитичный анализ случившегося. Так что же произошло на самом деле и каковы наши шансы увидеть подобное у себя дома?

[miniorange_social_login]

Комментарии

29 Комментариев
-
0
+
НИУ ВШЭ. Куда уж токсичнее.
-
1
+
А вот и токсичные речи шовинистов, которые приводят их к "негативным последствиям для психического здоровья"...
-
1
+
Я уж было подумал что мои коменты провоцируют активность интернет-борцунков за свободы™, но не тут-то было - перестал заходить/отвечать, а ололошечки ринулись молотить по клавишам с удвоенной силой 🙄 и окончательно заспамили коменты. Раньше хоть на время уползали зализывать душевные раны 😁
Affidavit Donda
06.10.2022
-
3
+
Осталось только членораздельно рассказать, что же такое эта самая "токсичная речь"(ц).
    -
    1
    +
    Главное -- не определения терминов, а применение алгоритмов... )
    +
      ещё комментарии
      -
      -1
      +
      ГРигорьев, а не нужно ничего "присобачивать" сюда: любые личные оценки в отношении отдельных людей или сообществ являются потенциально токсичными. но есть конечно тонкая грань допустимого, а вот Вы скажите-ка, будет ли сегодняшний "человек ленивый" за просто так годами(!) унижать и оплёвывать другого если у него нет личной заинтересованности? это даже не уголовная культура - это "культура ненависти,, о которой у лингвистов есть целые исследования В самой статее речь о другом: постоянные троллячьи "подбросы" могут вызывать цепную реакцию, и тогда "новое общественное мнение" выкашивает целые ветви потенциальных обсуждений, уступая место тупому переругиванию, и вместо содержательной беседы возникает объёмное но пустое перебрасывание шаблонных обвинений, так что даже равнодушному к любым проблемам плебса правительству (в широком смысле слова) тошно делается
        Affidavit Donda
        07.10.2022
        -
        -1
        +
        будет ли сегодняшний "человек ленивый" за просто так годами(!) унижать и оплёвывать другого если у него нет личной заинтересованности?
        И тут сразу вспоминаются отважные интернет-воевошки, храбро копротивляющиеся против свободы, демократии, сказочной страны Запад™ и вообще всего, на что им указывают их духовненькие лидерки.
          -
          -1
          +
          Донда да ты ведь и есть та самая интернет-воевошка что строчит десятки бессмысленных постов в день и неустанно копротивляется в них врагам "демократии", "свободы" и Запад™ Но конечно "это другое" 😅
            Affidavit Donda
            07.10.2022
            -
            0
            +
            А вот и первая храбрая воевошка, отважно триггернувшись на ненавистное имя, бесстрашно навалила кучку "своих" духовных "ценностей" под словами ненавистного врага.
              -
              1
              +
              на ненавистное имя, отважно навалила кучку "своих" духовных "ценностей" под словами ненавистного врага
              Как наверное одинок этот чудак. На любовь явно уже не рассчитывает, но мечтает вызвать хотя бы ненависть у никнеймов в интернетах. А ведь не старый еще дяденька. Неужто все вот так плохо?
                -
                1
                +
                Так ведь он никого лично не трогал, но именно вам сапог пришелся на ногу...
                -
                0
                +
                Ну вот лежит какашка на дороге тоже лично никого не трогает но воняет. Понятна ассоциация или опять скринов показать со следами жизнедеятельности пациента? И не надо мне рассказывать что идейно близкое дерьмо для тебя благоухает как розы. Не все же у нас с такими особенностями восприятия.
                -
                1
                +
                Ну вот лежит какашка на дороге тоже лично никого не трогает но воняет.
                Вы тут своим специфическим запахом куда заметнее. Донда вас, шовинистов, просто троллит, а вы то всерьез с ним пытаетесь бороться, и в этот момент начинаете еще и выглядеть очень глупо... Чего он и добивается.
                -
                1
                +
                Ну я же просил не рассказывать про розы 😄 Да Лева спасибо ты указал мое слабое место. Я слишком много времени трачу на вразумление людей к вразумлению непригодных.
                -
                0
                +
                Да Лева спасибо ты указал мое слабое место.
                Иван, вы очень непонятливы -- Донда, похоже, набирает материал, проверяя какую-то свою теорию различий в реакциях людей с коллективистским сознанием на самые простые стимулы... Вы даете ему самый обширный материал...
                Affidavit Donda
                08.10.2022
                -
                0
                +
                Чего он и добивается.
                Ну вот меня и спалили. :-))) А так-то да, я недолюбливаю национально обиженных, зато мне нравится причинять им аршеншмерц.
                Affidavit Donda
                08.10.2022
                -
                1
                +
                Ну вот лежит какашка на дороге тоже лично никого не трогает но воняет.
                Ты очень точно описал самого себя.
                идейно близкое дерьмо для тебя благоухает как роз
                С вашей братией дело обстоит именно так.
                Affidavit Donda
                08.10.2022
                -
                0
                +
                Что же ты пишешь о себе в третьем лице?
            -
            1
            +
            Иван, не тратьте время на идиотских бандерлогов..) Это пустое занятие. В их словесном поносе не найти и капли смысла)
        -
        1
        +
        Вот это оно и есть --
        объёмное но пустое перебрасывание шаблонных обвинений,
        Кстати, по-русски правильнее писать "шаблонными обвинениями".
        равнодушному к любым проблемам плебса правительству (в широком смысле слова) тошно делается
        "Как это верно, Ватсон!" И от того оно заказывает такие исследования и применяет их результаты в репрессивных целях... ))
-
1
+
"Токсичная речь в онлайн-разговорах должна рассматриваться как вопрос серьезной социальной значимости, поскольку она может привести как к негативным последствиям для психического здоровья, так и к насильственным действиям в физическом мире". В РФ насилие по результатам анализа текстов в интернете совершают в основном ФСБ, Следком, прокуратура и полиция, вот кто-то из них и был реальным заказчиком этого исследования под кодовым названием "Большой брат следит за тобой"...
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно