• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
08.02.2024, 09:55
Полина Меньшова
242

Человеческое восприятие помогло ИИ улучшить качество аудиозаписей

❋ 5.7

Нейросеть и человек воспринимают звук по-разному. Из-за этого алгоритмы для улучшения звука не всегда обрабатывают аудио желаемым образом. Ученые разработали новую модель глубокого обучения, которая опирается на человеческие оценки звуковой дорожки и способна улучшать аудиозаписи более эффективно.

Девушка слушает аудиозапись в наушниках
Девушка слушает музыку в наушниках / © pxhere.com / Автор: Андрей Чернов

Поведение искусственного интеллекта как правило стараются приблизить к человеческому, чтобы сделать помощником людей в разных сферах. Например, в Японии появился шагающий робот с настоящей мышечной тканью, а в Великобритании роботизированный датчик научили распознавать шрифт Брайля как человек, но в два раза быстрее.

Специалисты из Индианского университета в США разработали глубокую нейросеть, которая при редактуре аудиозаписи опирается на человеческое восприятие. Результаты их работы опубликовали в журнале IEEE/ACM Transactions on Audio, Speech and Language Processing. Новая модель ориентируется не только на объективные показатели качества звука, но и на субъективные оценки людей. Это позволяет учитывать случаи, когда формально четкая запись речи воспринимается как зашумленная, и понимать, какие приемлемые для нейросети сигналы относятся к нежелательным для человеческого уха.

Исследователи сообщили, что новую модель глубокого обучения успешно протестировали. Они сосредоточились на усилении речи, которая поступает из одного аудиоканала — микрофона. Для теста использовали два набора данных из предыдущих исследований — информацию о том, как люди по шкале от 1 до 100 оценили записи разговоров с фоновыми шумами, например звуком работающего телевизора или музыкой. Использовался метод совместного обучения: он предполагает не только языковой модуль для усиления речи, но и алгоритм, прогнозирующий среднюю человеческую оценку зашумленного сигнала.

Ученым удалось добиться высокого соответствия предсказаний модели относительно человеческого восприятия аудиозаписи реальным оценкам, которые звуковым дорожкам ставили люди. Это значит, что алгоритм при работе со звуком действительно способен учитывать не только объективные показатели.

Тем не менее, отметили исследователи, у работы с субъективными оценками есть сложности. Восприятие людей различается в зависимости от физиологических особенностей, личного опыта, а также наличия слухового аппарата или кохлеарного имплантата. Однако ученые продолжат совершенствовать созданную моделью, чтобы она могла работать с более сложными аудиозаписями и подстраиваться под постоянно меняющиеся ожидания людей.

Разработанную технологию, по мнению авторов статьи, можно будет применять в разных сферах. В частности, она поможет создать более комфортные для пользователей слуховые аппараты, программы распознавания речи, а также приложения для проверки громкоговорителей и систем громкой связи.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
1 декабря, 13:33
КАИ

В Передовой инженерной школе КНИТУ-КАИ (ПИШ КАИ) действуют временные научные коллективы (ВНК), работающие над реальными инженерными задачами. Одним из наиболее ярких результатов стала работа ВНК-4, созданного для развития технологий в области легких авиационных систем. Проект реализуется под руководством Никиты Сёмина, который также возглавляет специальное образовательное пространство (СОП) ПИШ КАИ «Авиамоделирование».

3 декабря, 09:56
Александр Березин

Человеческие эмбрионы до восьми недель способны полностью восстанавливать повреждения, как аксолотли. Но потом организм выключает гены, которые позволяют это делать — и наука пока не знает почему. Но она уже пытается вернуть такую возможность взрослым. И хотя масштаб задачи огромен, кое-чего ученым из России уже удалось добиться. Причем это не только имплантаты, но и биофабрикация живых тканей на замену утраченным.

2 декабря, 17:10
Игорь Байдов

На холмах Западной Турции расположены сотни памятников бронзового века. На протяжении десятилетий их связывали с разрозненными поселениями, которые существовали независимо друг от друга. Однако археологи собрали доказательства, указывающие на то, что эти поселения могли быть частью ранее неизвестной цивилизации, которая представляла собой мощную политическую силу, державшую в напряжении Восточное Средиземноморье почти 3200 лет назад.

29 ноября, 12:42
Александр Березин

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

27 ноября, 20:20
Максим Абдулаев

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

27 ноября, 11:05
Игорь Байдов

Долгое время ученые полагали, что сотни гигантских статуй на острове Пасхи создали представители местной общины под руководством одного вождя. Однако авторы нового исследования поставили эту гипотезу под сомнение. Детальная трехмерная карта главного каменного карьера острова указала на более сложную картину. Вероятно, монументы были плодом творчества и соперничества небольших независимых групп.

29 ноября, 12:42
Александр Березин

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

27 ноября, 20:20
Максим Абдулаев

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

20 ноября, 13:12
Полина Меньшова

Человеческие языки разнообразны, но это разнообразие ограничивается повторяющимися закономерностями. Пытаясь описать правила, которым подчиняются различия в грамматике, лингвисты сформулировали ряд так называемых грамматических универсалий — утверждений, предположительно верных для всех или большинства языков мира. Международная команда ученых провела статистический анализ на материале 2430 языков и обнаружила, что соответствующими действительности можно считать около трети таких утверждений.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно