Искусственный интеллект научили слушать несколько голосов одновременно — Naked Science
3 минуты
Редакция

Искусственный интеллект научили слушать несколько голосов одновременно

Система распознавания речи от Mitsubishi умеет слушать и понимать сразу нескольких человек, говорящих в один микрофон.

reu-egypt-usa_protest_008_1
©Wikipedia

Устройства с голосовым интерфейсом работают, когда в зоне слышимости их микрофона говорит один человек; если примешивается речь второго, у систем распознавания возникают проблемы. В кембриджской лаборатории компании Mitsubishi нашли решение этой проблемы. Технологию, позволяющую распознавать речь от двух до пяти одновременно говорящих человек, представили на этой неделе на техношоу Combined Exhibition of Advanced Technologies в Токио.

 

Благодаря разновидности технологии машинного обучения, которая называется «глубокий кластеринг», система учится выделять характеристики голосов, отличающие говорящих друг от друга, и по ним различать речь одновременно говорящих людей. Систему обучали с помощью образцов речи 100 носителей английского языка, но представители Mitsubishi утверждают, что система справляется и с обработкой других языков, в том числе японского.

 

Если двое говорят в один и тот же микрофон, система разделяет их слова с 90% точностью. Показатель падает с увеличением числа спикеров: для троих он равен уже 80%. Во время испытаний система с приемлемой точностью распознавала речь до пяти одновременно говорящих человек. Ей также лучше, чем традиционным системам распознавания речи, удается распознавать голоса отдельных людей в шумных местах; сейчас специалисты компании работают над внедрением системы в шумные машины с голосовым интерфейсом — лифты и кондиционеры.

 

Авторы разработки говорят о двух потенциальных сферах применения технологии: первая — устройства с голосовым интерфейсом (компьютеры беспилотных автомобилей, персональных помощников), вторая — расшифровка аудиозаписей. Второй возможностью могут заинтересоваться спецслужбы, полиция и военные, считают в Mitsubishi.

Описание системы опубликовано в репозитории ArXive.org.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Вчера, 08:54
8 минут
Мария Азарова

Хотите увидеть ожившего Шекспира или подмигивающую вам госпожу Лизу дель Джокондо? С немного пугающей всех нас технологией deepfake это можно сделать всего за пару минут.

Вчера, 19:50
5 минут
Илья Ведмеденко

По информации источника в ВПК, российские инженеры приступили к созданию стратегического ракетного комплекса нового поколения, получившего условное обозначение «Кедр». Сейчас его разработка находится на самой ранней стадии.

11 часов назад
4 минуты
Илья Ведмеденко

Китай достиг прогресса в разработке ракеты-носителя, которая сможет запустить пилотируемый космический корабль на Луну. Предполагается, что его грузоподъемность составит примерно 100 тонн.

26 февраля
10 минут
Василий Парфенов

Даже при разработке точнейших научных инструментов случаются разные технические сюрпризы — и хорошо, если приятные. К счастью, именно так вышло на этот раз. Ученые получили очередную порцию данных с космического аппарата Parker Solar Probe и здорово удивились. На сделанном в оптическом диапазоне снимке ночной стороны Венеры видны детали поверхности, обычно скрытые плотными облаками. Теперь предстоит решить загадку: либо камера оказалась чувствительна к инфракрасному диапазону излучения, либо случайно обнаружилось «окно» для наблюдений через атмосферу этой планеты.

23 февраля
4 минуты
Виктория Сафронова

Звук — шум от передвижения марсохода — записан одним из его микрофонов.

24 февраля
10 минут
Мария Азарова

Ученые провели анализ по 353 профессиям и оценили, насколько различия в статусе потребления алкоголя можно объяснить родом занятий.

21 февраля
20 минут
Василий Парфенов

Кого и что только ни успели уже обвинить в технологической катастрофе, которая произошла на этой неделе в США. Но эмоции плавно оседают, и начинают появляться первые результаты разбирательства. А они порой вызывают искреннее недоумение, честно говоря.

2 февраля
44 минуты
Александр Березин

В научном журнале The Lancet появились итоги клинических испытаний «Спутника-V», и на первый взгляд эта публикация — триумф. Российская вакцина показала эффективность выше, чем у Pfizer и Moderna. Увы, на этом хорошие новости закончились. Плохих две.

26 февраля
10 минут
Василий Парфенов

Даже при разработке точнейших научных инструментов случаются разные технические сюрпризы — и хорошо, если приятные. К счастью, именно так вышло на этот раз. Ученые получили очередную порцию данных с космического аппарата Parker Solar Probe и здорово удивились. На сделанном в оптическом диапазоне снимке ночной стороны Венеры видны детали поверхности, обычно скрытые плотными облаками. Теперь предстоит решить загадку: либо камера оказалась чувствительна к инфракрасному диапазону излучения, либо случайно обнаружилось «окно» для наблюдений через атмосферу этой планеты.

[miniorange_social_login]

Комментарии

Написать комментарий

Подтвердить?
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: