• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
08.02.2024, 09:55
Полина Меньшова
242

Человеческое восприятие помогло ИИ улучшить качество аудиозаписей

❋ 5.7

Нейросеть и человек воспринимают звук по-разному. Из-за этого алгоритмы для улучшения звука не всегда обрабатывают аудио желаемым образом. Ученые разработали новую модель глубокого обучения, которая опирается на человеческие оценки звуковой дорожки и способна улучшать аудиозаписи более эффективно.

Девушка слушает аудиозапись в наушниках
Девушка слушает музыку в наушниках / © pxhere.com / Автор: Андрей Чернов

Поведение искусственного интеллекта как правило стараются приблизить к человеческому, чтобы сделать помощником людей в разных сферах. Например, в Японии появился шагающий робот с настоящей мышечной тканью, а в Великобритании роботизированный датчик научили распознавать шрифт Брайля как человек, но в два раза быстрее.

Специалисты из Индианского университета в США разработали глубокую нейросеть, которая при редактуре аудиозаписи опирается на человеческое восприятие. Результаты их работы опубликовали в журнале IEEE/ACM Transactions on Audio, Speech and Language Processing. Новая модель ориентируется не только на объективные показатели качества звука, но и на субъективные оценки людей. Это позволяет учитывать случаи, когда формально четкая запись речи воспринимается как зашумленная, и понимать, какие приемлемые для нейросети сигналы относятся к нежелательным для человеческого уха.

Исследователи сообщили, что новую модель глубокого обучения успешно протестировали. Они сосредоточились на усилении речи, которая поступает из одного аудиоканала — микрофона. Для теста использовали два набора данных из предыдущих исследований — информацию о том, как люди по шкале от 1 до 100 оценили записи разговоров с фоновыми шумами, например звуком работающего телевизора или музыкой. Использовался метод совместного обучения: он предполагает не только языковой модуль для усиления речи, но и алгоритм, прогнозирующий среднюю человеческую оценку зашумленного сигнала.

Ученым удалось добиться высокого соответствия предсказаний модели относительно человеческого восприятия аудиозаписи реальным оценкам, которые звуковым дорожкам ставили люди. Это значит, что алгоритм при работе со звуком действительно способен учитывать не только объективные показатели.

Тем не менее, отметили исследователи, у работы с субъективными оценками есть сложности. Восприятие людей различается в зависимости от физиологических особенностей, личного опыта, а также наличия слухового аппарата или кохлеарного имплантата. Однако ученые продолжат совершенствовать созданную моделью, чтобы она могла работать с более сложными аудиозаписями и подстраиваться под постоянно меняющиеся ожидания людей.

Разработанную технологию, по мнению авторов статьи, можно будет применять в разных сферах. В частности, она поможет создать более комфортные для пользователей слуховые аппараты, программы распознавания речи, а также приложения для проверки громкоговорителей и систем громкой связи.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Журналист, преподаватель НИУ ВШЭ, главный редактор медиа о русском языке «Изборник». Специализируется на популяризации лингвистики, психологии, нейробиологии и медицины.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
13 октября, 11:10
Илья Гриднев

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

13 октября, 12:45
Игорь Байдов

Ежедневное использование сыворотки с экстрактом тропического растения всего за восемь недель увеличило густоту и толщину волос у испытуемых. Международная группа исследователей проверила эффективность нового состава, объединившего, помимо экстракта растения, кофеин и белки, стимулирующие клеточный рост, и осталась довольна результатом.

13 октября, 12:49
Мария Азарова

Нобелевский комитет при Шведской королевской академии наук объявил, кого в 2025 году посчитали достойным премии по экономическим наукам.

13 октября, 11:10
Илья Гриднев

Согласно новой гипотезе, сознание возникает не только из-за активности нейронов, но и благодаря физическим процессам — электромагнитным полям от движения жидкости в мозге. Эта модель, как и ее предшественники, пока носит теоретический характер, но предлагает нестандартный взгляд на проблему синхронизации работы разных отделов мозга.

10 октября, 11:23
МГППУ

Креативность чаще всего ассоциируется с творчеством и искусством. Однако не всегда креатив направлен на благо. Например, схемы мошенников тоже можно назвать креативными, хотя они служат обману и личной выгоде. Такое «творчество» называют антисоциальным. К нему также относятся склонность ко лжи, оригинальной мести, злобным шуткам и розыгрышам, мошенничеству, дезинформации, политическим манипуляциям, слухам и домыслам. Психологи МГППУ рассмотрели особенности восприятия и понимания информации у людей с высокой антисоциальной креативностью и сравнили с характеристиками тех, кто обладает положительными чертами личности, в частности чертами Светлой триады — согласия, прощения и доброжелательности.

10 октября, 15:55
Игорь Байдов

Голые землекопы живут почти 40 лет — невероятный срок для грызуна размером с мышь. Недавнее открытие китайских ученых показало, что долголетие этим животным обеспечивает необычная версия одного белка, который не просто защищает организм, а буквально чинит его изнутри — ускоряет восстановление ДНК. Новые данные могут помочь продлить и человеческую жизнь.

20 сентября, 08:52
Александр Березин

Посадка, включая выгорание куска степи, прошла штатно, но часть грызунов на борту погибли. Правда, погубила их не повышенная космическая радиация полярной орбиты, влияние которой на млекопитающих планировали выявить в миссии, а более банальные причины.

26 сентября, 11:41
ИИМК РАН

Археологи Института истории материальной культуры РАН (ИИМК РАН), при поддержке фонда «История отечества» в ходе раскопок обнаружили на всемирно известной стоянке каменного века Костенки-17 в Воронежской области редчайшие украшения из зубов песца и окаменелой раковины, а также уникальный для этого времени нуклеус из бивня мамонта для снятия заготовок.

29 сентября, 15:09
Адель Романова

Обычно выбрасываемое кометой вещество придает ей заметное ускорение. Как выяснилось, с третьим известным науке межзвездным объектом 3I/ATLAS этого практически не происходит, хотя у него есть и кома, и хвост. Астрофизики сейчас пытаются найти этому объяснение.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно