• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
08.02.2024, 09:55
Полина Меньшова
238

Человеческое восприятие помогло ИИ улучшить качество аудиозаписей

❋ 5.7

Нейросеть и человек воспринимают звук по-разному. Из-за этого алгоритмы для улучшения звука не всегда обрабатывают аудио желаемым образом. Ученые разработали новую модель глубокого обучения, которая опирается на человеческие оценки звуковой дорожки и способна улучшать аудиозаписи более эффективно.

Девушка слушает аудиозапись в наушниках
Девушка слушает музыку в наушниках / © pxhere.com / Автор: Андрей Чернов

Поведение искусственного интеллекта как правило стараются приблизить к человеческому, чтобы сделать помощником людей в разных сферах. Например, в Японии появился шагающий робот с настоящей мышечной тканью, а в Великобритании роботизированный датчик научили распознавать шрифт Брайля как человек, но в два раза быстрее.

Специалисты из Индианского университета в США разработали глубокую нейросеть, которая при редактуре аудиозаписи опирается на человеческое восприятие. Результаты их работы опубликовали в журнале IEEE/ACM Transactions on Audio, Speech and Language Processing. Новая модель ориентируется не только на объективные показатели качества звука, но и на субъективные оценки людей. Это позволяет учитывать случаи, когда формально четкая запись речи воспринимается как зашумленная, и понимать, какие приемлемые для нейросети сигналы относятся к нежелательным для человеческого уха.

Исследователи сообщили, что новую модель глубокого обучения успешно протестировали. Они сосредоточились на усилении речи, которая поступает из одного аудиоканала — микрофона. Для теста использовали два набора данных из предыдущих исследований — информацию о том, как люди по шкале от 1 до 100 оценили записи разговоров с фоновыми шумами, например звуком работающего телевизора или музыкой. Использовался метод совместного обучения: он предполагает не только языковой модуль для усиления речи, но и алгоритм, прогнозирующий среднюю человеческую оценку зашумленного сигнала.

Ученым удалось добиться высокого соответствия предсказаний модели относительно человеческого восприятия аудиозаписи реальным оценкам, которые звуковым дорожкам ставили люди. Это значит, что алгоритм при работе со звуком действительно способен учитывать не только объективные показатели.

Тем не менее, отметили исследователи, у работы с субъективными оценками есть сложности. Восприятие людей различается в зависимости от физиологических особенностей, личного опыта, а также наличия слухового аппарата или кохлеарного имплантата. Однако ученые продолжат совершенствовать созданную моделью, чтобы она могла работать с более сложными аудиозаписями и подстраиваться под постоянно меняющиеся ожидания людей.

Разработанную технологию, по мнению авторов статьи, можно будет применять в разных сферах. В частности, она поможет создать более комфортные для пользователей слуховые аппараты, программы распознавания речи, а также приложения для проверки громкоговорителей и систем громкой связи.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
25 августа, 07:38
Адель Романова

В поиске сигналов от внеземных цивилизаций ученые решили сосредоточиться не на целенаправленных посланиях человечеству, а на случайных «утечках информации» из межпланетного пространства гипотетической обитаемой системы. По расчетам, в определенные моменты до нас могут доходить сигналы внеземной космической связи. Кстати, благодаря «общению» Земли с марсианскими и другими зондами мы тоже постоянно невольно сообщаем о себе в глубокий космос.

25 августа, 13:36
Юлия Трепалина

Группа ученых из Индии с помощью дронов впервые задокументировала полный цикл брачного поведения горбатых дельфинов вида Sousa plumbea. Исследователи полагают, что наблюдения помогут в сохранении этих животных, обитающих в прибрежных водах Индийского океана и страдающих от деятельности человека.

25 августа, 09:35
Любовь С.

Модель, представленная учеными из коллаборации DESI и Мичиганского университета (США), может перевернуть представления о происхождении темной энергии. Авторы нового исследования полагают, что черные дыры, поглощая вещество, постепенно преобразовывают его в энергию, гипотетически ответственную за расширение Вселенной.

22 августа, 10:48
ПНИПУ

К 2025 году около 30 стран приняли программы по развитию водородной энергетики, а совокупный объем инвестиций в эту область превысил 150 миллиардов долларов. Эксперты полагают, что замена дизельных авто на водородные снизит выбросы на 80-90%, а водородные самолеты способны уменьшить углеродный след на 50-75%. Но при использовании водорода в двигателях внутреннего или внешнего сгорания, происходит взаимодействие с металлом, что наиболее опасно при высоких температурах. Это может вызвать их разрушение, в результате чего возникает риск пожара или взрыва с тяжелыми последствиями для пассажиров. Ученые Пермского Политеха впервые выяснили, как водород влияет на металлы в условиях экстремальных температур (800 градусов и выше), в которых работают двигатели самолетов и машин. Это продвинет авиационную, машиностроительную и нефтегазовую отрасли в безопасном использовании водорода в качестве источника энергии.

22 августа, 14:45
Игорь Байдов

Ученые обнаружили косвенные доказательства существования мира размером с Землю за орбитой Нептуна. Эта гипотетическая планета отличается от предполагаемой Девятой планеты не только размером, но и гравитационным влиянием на другие объекты.

22 августа, 13:09
Юлия Трепалина

Большие кошки (Pantherinae) обычно охотятся на животных своего или меньшего размера. У снежных барсов, как выяснилось, другие предпочтения. Новое исследование показало, что ирбисы чаще нападают на взрослых горных козлов, которые как минимум вдвое превосходят хищников в весе. Ученые объяснили, с чем может быть связан такой выбор добычи.

6 августа, 20:59
Татьяна Пичугина

Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.

30 июля, 08:08
Редакция Naked Science

Возраст находок — около 5500 лет, они лежат во множестве круглых ям, чьи стены укреплены кирпичом. Среди обнаруженных орудий из кремня есть и сотни неиспользованных, которые могут быть ритуальным подношением богам.

31 июля, 08:28
Полина Меньшова

Гостингом (от английского «призрак») называют ситуацию, когда человек прекращает общение или отношения, «пропадая с радаров» без объяснения причин. Исследователи из США сымитировали такое поведение, а затем проанализировали реакцию людей на него.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно