Искусственный интеллект поможет бросить курить

По данным ВОЗ, в мире насчитывается примерно 1,1 миллиарда курильщиков. Россия занимает пятое место по числу курящих — более 45 миллионов человек. Чтобы побороться с печальной статистикой, ученые предложили способ борьбы с курением на основе искусственного интеллекта.

4 382

Выбор редакции

Ежегодно около 400 тысяч россиян погибают от заболеваний, связанных с курением. И пока государство принимает меры по ограничению потребления табака на законодательном уровне, исследователи разрабатывают эффективные методы на базе технологий искусственного интеллекта (ИИ). О том, как нейронные сети и машинное обучение могут помочь в борьбе с курением, рассказал Андрей Поляков, научный сотрудник лаборатории Philips Research Lab Rus.

 

Что можно сказать в целом об исследовании: как зародилась идея, почему именно искусственный интеллект должен помочь людям в отказе от курения?

 

— Одна из наиболее эффективных стратегий отказа от курения — врачебное консультирование. Во время консультаций специалист оказывает психологическую поддержку человеку, бросающему курить, не дать ему сорваться. Но очные консультации — довольно дорогое удовольствие для системы здравоохранения, да и у пациентов не всегда есть возможность часто посещать врача из-за удаленности профильных клиник.

 

Сотрудники российской и голландской лабораторий Philips Research задумались над решением этих задач. Ученые поставили перед собой цель масштабировать консультационные сессии на широкую аудиторию курящих людей, у которых есть смартфон с доступом в интернет. Результаты проведенного исследования были представлены летом 2018 года в Стокгольме на конференции IJCAI-2018. Идея состоит в том, чтобы автоматизировать терапевтическое вмешательство и обеспечить удаленную помощь человеку в отказе от курения за счет возможностей искусственного интеллекта.

 

Речь идет о диалоговом агенте на смартфоне, который способен выбирать и применять одну из поддерживающих пациента стратегий. Он может распознавать эмоциональную окраску речевых или текстовых сообщений пациента, адекватно на нее реагировать и помогать человеку избавиться от вредной привычки.

 

Какие принципы ИИ положены в основу метода?

 

— Эти принципы основаны на моделировании методики отказа от курения с помощью когнитивно-поведенческой психотерапии и мотивационного интервьюирования, которые обычно проводит врач на приеме. Естественно, в живой беседе человек может понять настроение и состояние собеседника благодаря различным вербальным и невербальным сигналам: к ним относятся речь, голос, мимика, жестикуляция.

 

В нашем исследовании нас интересовал язык, на котором мы общаемся в мессенджерах и социальных сетях. Для того чтобы искусственный интеллект мог заменить врача-психотерапевта, ему нужно уметь распознавать устную и письменную речь человека, ее эмоциональную окраску, а также поддерживать беседу и реагировать на изменение состояния пациента.

 

Как искусственный интеллект учится анализировать речь?

 

— Методы глубокого обучения, в частности рекуррентные нейронные сети, в сочетании с доступностью вычислительных средств и накопленных данных позволили совершить прорыв во многих областях искусственного интеллекта, в том числе в сфере распознавания и обработки речи. С помощью этих технологий несколько высокотехнологичных компаний смогли создать голосовые помощники, с которыми можно общаться и ставить им задачи: Siri от Apple, Google Assistant от Google, Алиса от "Яндекса".

 

Хотя рекуррентные нейронные сети — популярное средство распознавания текста, они требуют большого объема размеченных данных, которые сложно собрать. Кроме того, процесс общения представляет собой пример обучения ИИ в нестационарной среде, поскольку наша речь сильно меняется как с течением времени, так и под влиянием национальных особенностей разных культур.

 

Эти факторы требуют локальной настройки и обслуживания классификатора (в нашем случае рекуррентной нейронной сети глубокого обучения) уже на уровне индивидуального пользователя. Одним из популярных подходов к непрерывному улучшению классификатора является активное обучение. Основная идея этих методов заключается в том, чтобы размечать только часть полученных данных, которые представляют интерес для дальнейшего применения.

 

Как правило, существующие сегодня способы активного обучения ИИ хорошо работают при решении традиционных задач. При этом они могут привести к неустойчивости технологии, что является распространенным явлением в архитектурах нейронных сетей глубокого обучения.

 

Наш метод представляет собой новый алгоритм активного обучения нейронных сетей, в основе которого лежат следующие принципы: обучение c частичным привлечением учителя (semi-supervised learning), рекуррентные нейронные сети и глубинное обучение и обработка естественных текстов (natural language processing).

 

Механизм работы следующий: алгоритму дается текстовое сообщение, каким оно бывает при общении в мессенджерах. Задача алгоритма — распознать его эмоциональную окраску по отношению к тематике курения. Она может быть положительной («Я лично бросил, не курю, я бодр и полон сил»), отрицательной («Снова курю») или нейтральной («Москва — столица России»).

 

Сообщения из Твиттера, обработанные нейронными сетями во время исследования / Пресс-служба Philips Research

Сообщения из Твиттера, обработанные нейронными сетями во время исследования / Пресс-служба Philips Research

 

В зависимости от эмоциональной окраски алгоритм применяет соответствующие стратегии поведения: сменить тему разговора в случае положительной окраски, поддержать беседу при отрицательной окраске и нейтрально отреагировать в случае нейтрального сообщения.

 

Как проводилось исследование эффективности этого метода, каковы были его результаты?

 

— Цель нашего исследования состояла в разработке нового метода поиска и отбора данных, представляющих особый интерес. Чтобы показать, какие именно данные нас интересуют, рассмотрим следующий пример. Представьте себе жюри присяжных, которое разбирает дело в суде и большинством голосов решает, виновен человек или нет. При этом жюри всегда может обратиться к волшебнику Мерлину, который точно знает, виновен ли подсудимый. Но за свои услуги он требует плату.

 

Жюри хочет выполнить свою работу по совести, но при этом обладает ограниченным бюджетом и не может по каждому делу обращаться к Мерлину. Дело считается неинтересным, если присяжные практически единогласно голосуют за виновность или невиновность, это простой случай. Но если голоса присяжных разделяются, то это представляет интерес.

 

В этом случае жюри обращается к волшебнику, получает ответ и при рассмотрении следующих аналогичных дел будет принимать более согласованные решения, что в будущем делает аналогичные случаи простыми. Переходя к терминологии алгоритма, под присяжными понимается классификатор (нейронная сеть), под жюри присяжных — комитет классификаторов, под судебным делом — сообщение в твиттере, под Мерлином — эксперт, делающий разметку сообщений.

 

Таким образом несколько нейронных сетей на базе накопленного опыта решают, какую эмоциональную окраску несет тот или иной твит. Например, если они практически единогласно дают твиту положительную эмоциональную окраску, в этом случае он классифицируется как положительный. Если же нейросети «путаются в показаниях», то твит помечается как интересный.

 

Далее собираются все интересные случаи, которые ранжируются по степени уверенности предсказаний классификаторов, после чего эти кейсы отправляются эксперту на разметку. Далее специалист проводит дополнительное обучение нейросетей уже на основе разобранных случаев.

 

Что в итоге получилось создать?

 

— В результате исследования был создан новый алгоритм активного обучения Query by Embedded Commettee (QBEC), который отличается от уже существующих по уровню точности и скорости. В ходе эксперимента мы применили новый алгоритм для классификации коротких текстовых сообщений из твиттера с использованием рекуррентных нейронных сетей.

 

Сначала была собрана и вручную размечена тренировочная база данных для ИИ более чем из 2300 англоязычных сообщений из твиттера, опубликованных с октября 2017-го по январь 2018 года. Октябрьские сообщения были связаны с европейской кампанией по отказу от курения Stoptober. В рамках этой акции люди бросают курить и в течение месяца публикуют твиты, в которых делятся впечатлениями об отказе от сигарет.

 

Декабрьские сообщения были написаны людьми, которые собирались бросить курить к Новому году. Дополнительно была собрана и вручную размечена тестовая база. Применяемая система классификации текстов была основана на современных архитектурах рекуррентных нейронных сетей глубокого обучения. Она была обучена на тренировочной базе твитов.

 

Точность классификатора, который научался с ее помощью, была очень низкой и едва превышала 50%. Далее мы провели еще один эксперимент, в котором последовательно применили механизм активного обучения: каждый день классификатор получал новую порцию целевых сообщений (порядка 3000 ежедневно) и отдавал 30 самых интересных кейсов на разметку.

 

Эти сообщения размечались вручную и добавлялись к тренировочной базе данных, которая использовалась для построения следующей модели классификатора. Исследование показало, что такой метод обучения искусственного интеллекта позволил качественно улучшить алгоритм. Вычислительные эксперименты и теоретические выкладки демонстрируют гораздо более высокую скорость работы алгоритма QBEC.

 

Это обстоятельство позволяет запускать алгоритм активного обучения QBEC даже на пользовательском устройстве, например смартфоне. Это значит, что у нас есть шанс создать эффективный голосовой помощник, который сможет взять на себя функцию врача и помогать людям, которые стремятся бросить курить.

 

Какие прогнозы можно сделать на основании этих результатов, насколько эффективен будет ИИ в качестве помощи людям в отказе от курения в будущем?

 

— Результаты исследования показывают, что искусственный интеллект способен распознавать эмоции пациента по тексту сообщения, при этом алгоритмы активного обучения позволяют непрерывно улучшать точность классификации данных. Сегодня наша задача состоит в том, чтобы в будущем процент отказавшихся от курения с помощью технологии ИИ был не ниже процента бросивших курить благодаря очным консультациям врача.

 

Внедрение ИИ в медицину может обеспечить снижение финансовой нагрузки на систему здравоохранения и охватить гораздо больше пациентов, которые хотят отказаться от сигарет и вести здоровый образ жизни.

 

Можно предположить, что в дальнейшем этот подход будет применяться в том числе для помощи пациентам с алкогольной или наркотической зависимостью. Также врачи смогут чаще обращаться к возможностям ИИ при выявлении психических расстройств.

 

Например, недавно ученые из Университета Пенсильвании разработали нейронную сеть, которая анализирует посты пользователей в фейсбуке и определяет наличие у людей депрессии. Диагностика этого заболевания не всегда однозначна, поэтому точность работы алгоритма во время исследования в 70% случаев была сопоставима с результатами медицинских скринингов.

 

Такие примеры доказывают, что возможности применения искусственного интеллекта в медицине безграничны и способны помочь врачам в решении множества социальных проблем.

Naked Science Facebook VK Twitter
Philips Research
2Статьи
Лаборатория Philips в «Сколково» – часть глобальной научно-исследовательской сети Philips Research, одной из крупнейших частных исследовательских организаций в мире. Более 1250 ученых работают в 10 лабораториях в нескольких локациях в Европе, Северной Америке, Китае, Индии, Африке и России. Работа российского подразделения интегрирована в глобальные исследовательские проекты компании.
4 382
Комментарии
Аватар пользователя Михаил Лещ
10 ч
Вы живете не трехмерном пространстве, а в трехмерной...
Аватар пользователя Михаил Лещ
10 ч
Прежде произносить слово математика, попробуйте...

Колумнисты

Физтех
111Статей
Сколтех
41Статья
Discovery Channel
32Статьи
СО РАН
7Статей
Комментарии

Быстрый вход

Или авторизуйтесь с помощью:

на сайте, чтобы оставить комментарий.
Вы сообщаете об ошибке в следующем тексте:
Нажмите Отправить ошибку