• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
08.02.2024, 09:55
Полина Меньшова
242

Человеческое восприятие помогло ИИ улучшить качество аудиозаписей

❋ 5.7

Нейросеть и человек воспринимают звук по-разному. Из-за этого алгоритмы для улучшения звука не всегда обрабатывают аудио желаемым образом. Ученые разработали новую модель глубокого обучения, которая опирается на человеческие оценки звуковой дорожки и способна улучшать аудиозаписи более эффективно.

Девушка слушает аудиозапись в наушниках
Девушка слушает музыку в наушниках / © pxhere.com / Автор: Андрей Чернов

Поведение искусственного интеллекта как правило стараются приблизить к человеческому, чтобы сделать помощником людей в разных сферах. Например, в Японии появился шагающий робот с настоящей мышечной тканью, а в Великобритании роботизированный датчик научили распознавать шрифт Брайля как человек, но в два раза быстрее.

Специалисты из Индианского университета в США разработали глубокую нейросеть, которая при редактуре аудиозаписи опирается на человеческое восприятие. Результаты их работы опубликовали в журнале IEEE/ACM Transactions on Audio, Speech and Language Processing. Новая модель ориентируется не только на объективные показатели качества звука, но и на субъективные оценки людей. Это позволяет учитывать случаи, когда формально четкая запись речи воспринимается как зашумленная, и понимать, какие приемлемые для нейросети сигналы относятся к нежелательным для человеческого уха.

Исследователи сообщили, что новую модель глубокого обучения успешно протестировали. Они сосредоточились на усилении речи, которая поступает из одного аудиоканала — микрофона. Для теста использовали два набора данных из предыдущих исследований — информацию о том, как люди по шкале от 1 до 100 оценили записи разговоров с фоновыми шумами, например звуком работающего телевизора или музыкой. Использовался метод совместного обучения: он предполагает не только языковой модуль для усиления речи, но и алгоритм, прогнозирующий среднюю человеческую оценку зашумленного сигнала.

Ученым удалось добиться высокого соответствия предсказаний модели относительно человеческого восприятия аудиозаписи реальным оценкам, которые звуковым дорожкам ставили люди. Это значит, что алгоритм при работе со звуком действительно способен учитывать не только объективные показатели.

Тем не менее, отметили исследователи, у работы с субъективными оценками есть сложности. Восприятие людей различается в зависимости от физиологических особенностей, личного опыта, а также наличия слухового аппарата или кохлеарного имплантата. Однако ученые продолжат совершенствовать созданную моделью, чтобы она могла работать с более сложными аудиозаписями и подстраиваться под постоянно меняющиеся ожидания людей.

Разработанную технологию, по мнению авторов статьи, можно будет применять в разных сферах. В частности, она поможет создать более комфортные для пользователей слуховые аппараты, программы распознавания речи, а также приложения для проверки громкоговорителей и систем громкой связи.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
4 марта, 13:56
Илья Гриднев

Биологи получили прямые доказательства поедания косатками представителей собственного вида. Оторванные спинные плавники со следами больших зубов указали на охоту плотоядных китообразных на слабую соседнюю популяцию. Угроза смертельных нападений заставила рыбоядные группы косаток создавать неразлучные семейные кланы.

4 марта, 14:46
Адель Романова

Исследователи смоделировали последствия распыления в марсианской атмосфере аэрозолей для создания искусственного парникового эффекта. Выяснилось, что это может привести к парадоксальному результату: вместо ожидаемого более комфортного климата будущая колония на «нагретой» Красной планете окажется посреди такого же лютого холода и притом окружена обезвоженным грунтом.

5 марта, 09:47
Игорь Байдов

За право называть себя родиной легендарных скрипок Страдивари долгие годы спорили несколько европейских стран. Исследователи из Швейцарии, Франции, Словении заявляли, что именно их леса послужили материалом для инструментов с неповторимым звучанием. Теперь история получила новый поворот. Международная команда изучила годичные кольца почти на 300 скрипках итальянского мастера и выяснила, в каком конкретно места Страдивари брал материал для своих лучших творений.

3 марта, 14:06
Александр Березин

В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.

28 февраля, 16:50
Игорь Байдов

В той части Пиренеев, которые находятся на территории Испании, исследователи обнаружили первые доказательства добычи золота в эпоху Римской империи. На месте древних рудников нашли сложные гидравлические сооружения и остатки водохранилища, возраст которых определили с помощью метода оптического датирования. Открытие прольет свет на инженерные приемы римлян и поставит точку в многолетнем споре: действительно ли римляне добывали золото в этом регионе.

28 февраля, 11:53
Андрей Серегин

Разное отношение домашних животных к хозяевам давно стало предметом споров, обсуждений и шуток. Ученые из Венгрии показали, что собаки демонстрируют по отношению к человеку уровень альтруизма, сходный с детским, тогда как кошки ищут в партнерстве с человеком прежде всего свою выгоду.

12 февраля, 07:52
Адель Романова

Астрономы недавно проанализировали базу данных о падающих на Землю объектах и пришли к выводу, что два из них прибыли из межзвездного пространства. Известна не только дата, но и место падения каждого из них.

12 февраля, 08:19
Полина Меньшова

«Любить лишь можно только раз», — писал поэт Сергей Есенин, а герои культовых сериалов приходили к выводу, что «настоящая» влюбленность случается в жизни максимум дважды. Однако ни один из этих тезисов не подкреплен научными данными. Американские исследователи подошли к вопросу иначе: опросили более 10 тысяч человек и вывели среднее число сильных влюбленностей, возможных в течение жизни.

3 марта, 14:06
Александр Березин

В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно