Колумнисты

Ученые МТУСИ разработали новые возможности в аудиоаналитике

В научно-исследовательском отделе разработки прикладного и системного программного обеспечения МТУСИ создали сервис KSA — Keyword spotting application, который поможет автоматически находить и извлекать ключевые слова из аудиозаписей.

Keyword spotting (распознавание ключевых слов) в аудиоаналитике — это технология, которая позволяет автоматически находить и извлекать ключевые слова из аудиоматериалов. Разработка может применяться в различных областях: безопасность, медицина, производство и реклама.

Keyword spotting может помочь в обеспечении безопасности на производстве путем автоматического мониторинга аудиопотоков на предмет ключевых слов, связанных с опасными ситуациями или небезопасными действиями. При обнаружении таких ключевых слов система автоматически отправляет предупреждения на мониторы безопасности или к другим ответственным лицам на производстве.

Это позволяет оперативно реагировать на возможные угрозы и принимать меры для предотвращения возможных несчастных случаев. Кроме того, система может использоваться для голосового управления техникой и решения широкого спектра технических задач.

В системе используются такие методы машинного обучения, как транслируемые сверточные сети последнего поколения BC-Resnet. Эти модели сегодня являются одними из лидеров в показателях точности в задаче KWS (Keyword spotting) в бенчмарке Google Speech Command. Модель, используемая в данном сервисе, обучена на специально собранном DataSet и имеет точность 91,86 процентов по метрике ROC-AUC.

Развитие системы немаловажно, поскольку она улучшает эффективность и точности анализа данных. Это помогает сократить время и ресурсы, затрачиваемые на ручной анализ, и повысить качество получаемых результатов. Более точные и эффективные системы могут существенно повысить безопасность и качество жизни людей в различных областях.

Комментарии

  • У вас на фото биржевые графики. Причём тут аудио анализ?