Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В НИУ ВШЭ построили рейтинг тем, вызывающих самые токсичные онлайн-комментарии
Исследователи Высшей школы бизнеса НИУ ВШЭ создали модель, которая может автоматически выявлять токсичные комментарии, написанные на русском языке. Алгоритм определил их долю среди разных тем в социальной сети «Пикабу». Больше всего таких записей было под постами о политике, темы безопасности и социально-экономического развития заняли второе и третье места.
Результаты работы опубликованы в сборнике IEEE International Conference on Business Informatics. Токсичная речь в онлайн-беседах может привести не только к негативным последствиям для психического здоровья, но и к насилию в реальном мире. Под токсичностью в интернете понимают грубый, неуважительный или необоснованный комментарий, который может заставить людей покинуть обсуждение или отказаться от того, чтобы делиться своей точкой зрения.
Ученые Высшей школы экономики изучили, какие темы вызывают наиболее острые комментарии, на примере социальной сети «Пикабу». Для этого была создана модель машинного обучения, которая способна автоматически определять токсичные комментарии на русском языке, а также разработана методология для категоризации постов по разным темам.
Исследователи отобрали корпус из 521 050 постов и 19 275 438 комментариев, размещенных в 2019 году. Для исследования были взяты темы, которые относятся к основным направлениям измерения субъективного благополучия: политика, здоровье, социально-экономическое развитие, безопасность, окружающая среда, возможности трудоустройства.
В отличие от предыдущих работ, ученые не только сосредоточились на тренировке модели, но и опробовали ее на практике. В рамках исследования была создана модель ToxicRuBERT-TPikabu, которая может автоматически определять токсичные комментарии, написанные на русском языке. Поскольку обучение подобных нейронных сетей требует значительного количества вычислительных мощностей, авторы исследования использовали суперкомпьютер НИУ ВШЭ.
«Для классификации токсичных комментариев мы вручную разметили набор данных через Yandex.Toloka и провели эксперименты по обучению классификаторов на основе языковых моделей RuBERT и ToxicRuBERT. В наших исследованиях по классификации токсичности и настроений в русскоязычных текстах эти модели демонстрировали более высокое качество классификации, чем другие», — рассказывает соавтор исследования, аспирант департамента бизнес-информатики Высшей школы бизнеса НИУ ВШЭ Сергей Сметанин.
Анализ постов «Пикабу» показал, что наибольшая доля токсичных комментариев была под постами о политике (вполне ожидаемо), темы безопасности и социально-экономического развития заняли второе и третье места, а остальные темы показали примерно одинаковые значения. «Будущие исследования могут быть связаны с изучением особенностей распространения токсичного контента. Некоторые исследования уже показывают, что такой стиль может быть заразным: грубость и неуважение к собеседнику со стороны одного пользователя приводят к тому, что и другие пользователи отвечают в схожем ключе», — рассказывает Сергей Сметанин.
Чем больше спорят об энергетике будущего, тем очевиднее: атомные электростанции останутся ее частью. Ученые Пермского Политеха рассказали, как устроен этот мощный и сложный механизм, как системы предотвращают катастрофы при остановке реактора, почему таблетка урана-235 заменяет целый баррель нефти, можно ли жить рядом с АЭС, куда исчезают радиоактивные отходы и почему атомная энергия считается «зеленой».
Состояние паралича, в которое впадают разные виды животных, хорошо известно и задокументировано. Обычно оно считается защитной реакцией в случае опасности, но никаких доказательств этому до сих пор нет. Особенно загадочным остается поведение обитателей океана, притворяющихся мертвыми. Ученые проверили существующие объяснения этого эффекта и сделали неожиданные выводы.
До сих пор ученые считали, что величайшую из женщин — фараонов Египта после смерти подвергли «культурной отмене»: ее статуи разбивали, имя вычеркивали из надписей, обелиски засыпали песком. Цзюнь И Вон из Университета Торонто (Канада) подверг сомнению это утверждение, но и в его гипотезе остаются вопросы.
Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.
Состояние паралича, в которое впадают разные виды животных, хорошо известно и задокументировано. Обычно оно считается защитной реакцией в случае опасности, но никаких доказательств этому до сих пор нет. Особенно загадочным остается поведение обитателей океана, притворяющихся мертвыми. Ученые проверили существующие объяснения этого эффекта и сделали неожиданные выводы.
Квантовые спиновые жидкости (КСЖ) обещают ученым развитие в областях квантовых вычислений и передачи энергии без потерь. В них магнитные моменты частиц теоретически не должны упорядочиваться даже при охлаждении до абсолютного нуля температур.
Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.
Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.
Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.
сайт превращается в бандерложью помойку с кривляющимися кретинамиТы снова очень точно описал вашу шоблу и то, что вы хотите сделать из сайта.
будет ли сегодняшний "человек ленивый" за просто так годами(!) унижать и оплёвывать другого если у него нет личной заинтересованности?И тут сразу вспоминаются отважные интернет-воевошки, храбро копротивляющиеся против свободы, демократии, сказочной страны Запад™ и вообще всего, на что им указывают их духовненькие лидерки.
на ненавистное имя, отважно навалила кучку "своих" духовных "ценностей" под словами ненавистного врагаКак наверное одинок этот чудак. На любовь явно уже не рассчитывает, но мечтает вызвать хотя бы ненависть у никнеймов в интернетах. А ведь не старый еще дяденька. Неужто все вот так плохо?
Ну вот лежит какашка на дороге тоже лично никого не трогает но воняет.Вы тут своим специфическим запахом куда заметнее. Донда вас, шовинистов, просто троллит, а вы то всерьез с ним пытаетесь бороться, и в этот момент начинаете еще и выглядеть очень глупо... Чего он и добивается.
Да Лева спасибо ты указал мое слабое место.Иван, вы очень непонятливы -- Донда, похоже, набирает материал, проверяя какую-то свою теорию различий в реакциях людей с коллективистским сознанием на самые простые стимулы... Вы даете ему самый обширный материал...
Чего он и добивается.Ну вот меня и спалили. :-))) А так-то да, я недолюбливаю национально обиженных, зато мне нравится причинять им аршеншмерц.
Ну вот лежит какашка на дороге тоже лично никого не трогает но воняет.Ты очень точно описал самого себя.
идейно близкое дерьмо для тебя благоухает как розС вашей братией дело обстоит именно так.
объёмное но пустое перебрасывание шаблонных обвинений,Кстати, по-русски правильнее писать "шаблонными обвинениями".
равнодушному к любым проблемам плебса правительству (в широком смысле слова) тошно делается"Как это верно, Ватсон!" И от того оно заказывает такие исследования и применяет их результаты в репрессивных целях... ))
про шрапнель в Хаймарсах(U+2122) - Вы что думаете?Это вопрос к А. Березину...
будет ли сегодняшний "человек ленивый" за просто так годами(!) унижать и оплёвывать другого если у него нет личной заинтересованности?И тут сразу вспоминаются отважные интернет-воевошки, храбро копротивляющиеся против свободы, демократии, сказочной страны Запад™ и вообще всего, на что им указывают их духовненькие лидерки.
на ненавистное имя, отважно навалила кучку "своих" духовных "ценностей" под словами ненавистного врагаКак наверное одинок этот чудак. На любовь явно уже не рассчитывает, но мечтает вызвать хотя бы ненависть у никнеймов в интернетах. А ведь не старый еще дяденька. Неужто все вот так плохо?
Ну вот лежит какашка на дороге тоже лично никого не трогает но воняет.Вы тут своим специфическим запахом куда заметнее. Донда вас, шовинистов, просто троллит, а вы то всерьез с ним пытаетесь бороться, и в этот момент начинаете еще и выглядеть очень глупо... Чего он и добивается.
Да Лева спасибо ты указал мое слабое место.Иван, вы очень непонятливы -- Донда, похоже, набирает материал, проверяя какую-то свою теорию различий в реакциях людей с коллективистским сознанием на самые простые стимулы... Вы даете ему самый обширный материал...
Чего он и добивается.Ну вот меня и спалили. :-))) А так-то да, я недолюбливаю национально обиженных, зато мне нравится причинять им аршеншмерц.
Ну вот лежит какашка на дороге тоже лично никого не трогает но воняет.Ты очень точно описал самого себя.
идейно близкое дерьмо для тебя благоухает как розС вашей братией дело обстоит именно так.
объёмное но пустое перебрасывание шаблонных обвинений,Кстати, по-русски правильнее писать "шаблонными обвинениями".
равнодушному к любым проблемам плебса правительству (в широком смысле слова) тошно делается"Как это верно, Ватсон!" И от того оно заказывает такие исследования и применяет их результаты в репрессивных целях... ))
про шрапнель в Хаймарсах(U+2122) - Вы что думаете?Это вопрос к А. Березину...
сайт превращается в бандерложью помойку с кривляющимися кретинамиТы снова очень точно описал вашу шоблу и то, что вы хотите сделать из сайта.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
ПонятноИз-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
ПонятноНаши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
ПонятноМы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Комментарии