Рубрика Наука

Искусственный интеллект предскажет вспышки сифилиса по Google и Twitter

Американские исследователи создают алгоритмы, способные оценивать вероятность вспышки сифилиса на определенной территории, используя данные поисковых запросов и посты в Twitter.

Специалисты Центров по контролю и профилактике заболеваний США (CDC) совместно с учеными из Калифорнийского университета в Лос-Анджелесе работают над алгоритмами, которые смогут предугадывать вспышки сифилиса. Вычислить потенциально опасные территории позволит анализ популярных поисковых запросов и активности пользователей Twitter в регионе. Статьи о новых разработках опубликованы в журналах Epidemiology и Preventive Medicine.

 

Сегодня сифилис остается социально значимой болезнью. По данным Всемирной организации здравоохранения, он повышает риск ВИЧ-инфицирования, а также может передаваться от матери к ребенку во время беременности. Возбудитель заболевания постепенно приобретает устойчивость к современным лекарственным препаратам. Ежегодно сифилисом заражаются около 5,6 миллиона человек.

 

Возбудитель сифилиса Treponema pallidum / © CDC/ Dr. David Cox

 

Разработчики одного из алгоритмов поясняют: «Поскольку люди, находящиеся в группах риска заражения сифилисом, могут искать информацию о сексуальном здоровье и соответствующих угрозах в интернете, мы исследовали связь между данными о поисковых запросах по штатам и зафиксированными случаями заболевания».

 

Исследователи использовали данные сервиса Google Trends за 155 недель, с 2012 по 2014 год. Алгоритм выявил, насколько часто в течение каждой недели люди из разных штатов искали ключевые фразы, связанные с распространением инфекций, передаваемых половым путем (ИППП). В список вошли запросы: «есть ли у меня ИППП», «помощь при ИППП», «симптомы ИППП» и «секс без презерватива». Затем эти данные совместили с информацией о том, сколько случаев сифилиса выявили в штате на следующей неделе. После обучения искусственный интеллект успешно «предсказал» вероятность вспышки заболевания в определенном штате на протяжении следующих 144 недель. При этом программа различала случаи первичного и вторичного сифилиса.

 

Другая технология, использованная для прогнозирования, — анализ больших массивов записей в Twitter. Исследователи собрали 8,5 тысячи твитов с ключевыми словами и распределили их по данным геолокации. На основе твитов 2012 года алгоритму удалось эффективно предугадать вспышки заболевания, случившиеся в 2013-м. До этого аналогичным образом подсчитывали вероятность эпидемий гриппа.

 

Эти исследования показывают, что анализ поисковых запросов и социальных сетей может стать эффективным инструментом превентивной медицины. Ранее выяснилось, что онлайн-сервисы повышают число молодых людей, проходящих тестирования на ИППП.