06.03.2018
Редакция Naked Science
3

Искусственный интеллект научили имитировать человеческий голос

Сотрудники пекинской компании Baidu создали роботизированную систему, которая воспроизводит человеческую речь, с точностью копируя ее уникальные характеристики.

740full-the-terminator-screenshot
©Wikipedia

Технология под названием Deep Voice работает на основе машинного обучения: она «тренировалась» на звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов, при этом она может обмануть системы распознавания голоса с помощью всего десяти пятисекундных семплов.

 

Deep Voice точно имитирует тембр и интонации голоса, что делает производимые им звуки неотличимыми от настоящих, и, по мнению создателей, система найдет широкое применение в совершенно разных областях. Например, она может быть использована для создания персонализированных цифровых помощников, оказания услуг по автоматическому синхронному переводу, озвучивания книг, фильмов и видеоигр. Более того, нейросеть облегчит жизнь тем, кто по каким-то причинам утратил возможность говорить, и скрасит одиночество детей, читая им сказки на ночь, когда родители уехали в командировку. Интересно, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.

 

Голосовой помощник Deep Voice / © Baidu

 

«Это настоящий прорыв с технической точки зрения, – говорит один из авторов разработки Лео Зу (Leo Zou). – Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями».

 

Ранее канадскими разработчиками был создан похожий голосовой сервис под названием Lyrebird. Он сжимает все индивидуальные речевые характеристики в очень короткую запись, воспроизводя 1000 предложений всего за полсекунды. Система легко копирует любые звуки, начиная от «жужжания» бензопилы и заканчивая пением тропических птиц, а также может генерировать новые голоса и добавлять старым определенный тон: сердитый, веселый, сочувствующий. Lyrebird, также как и Deep Voice, применяется для работы голосовых помощников, озвучивания мультимедийных продуктов и синтеза речи людей с ограниченными возможностями.

 

Правда, у обеих технологий есть общая проблема: возможно, ими захотят воспользоваться мошенники, чтобы вводить людей в заблуждение или обманывать программы, работающие на основе распознавания речи. А юристы опасаются, что в скором времени аудиозаписи перестанут являться доказательством в ходе судебных процессов.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Вчера, 14:06
Мария Азарова

Американские исследователи оценили вероятность повторного заражения коронавирусами SARS-CoV, HCoV-229E, HCoV-OC43, HCoV-NL63 и особенно SARS-CoV- 2.

8 часов назад
Мария Азарова

По мнению японских ученых, гиперинсулинемию и связанную с ней сверхэкспрессию белка GRP78 следует рассматривать как терапевтическую или профилактическую цели в свете пандемии коронавируса.

Вчера, 17:59
Мария Азарова

В Великобритании провели крупное популяционное исследование с участием более 32 миллионов человек. Авторы работы изучили неврологические осложнения, связанные с вакцинами ChAdOx1nCoV-19 и BNT162b2, а также после самого Covid-19.

Вчера, 14:06
Мария Азарова

Американские исследователи оценили вероятность повторного заражения коронавирусами SARS-CoV, HCoV-229E, HCoV-OC43, HCoV-NL63 и особенно SARS-CoV- 2.

22 октября
Ольга Иванова

Американские исследователи пришли к выводу, что человеческий мозг уменьшился из-за процессов глобализации, кооперации и разделения труда.

22 октября
Александр Березин

Повелители тундростепей Евразийского континента, оказывается, вовсе не вымерли с концом ледникового периода. Вопреки тому, что считалось ранее, они выжили — как минимум на Таймыре и как минимум до 1900 года до нашей эры. А это на много веков позже постройки пирамиды Хеопса. Получается, человек не привел мамонта к вымиранию? Или, напротив, нашел затерянные на Таймыре остатки вида и уничтожил их совсем недавно? Это сложный вопрос, от которого зависит ответ на другой: могут ли слоны заселить Север России и в наши дни?

13 октября
Мария Азарова

Анализ образцов крови, взятых у российских космонавтов до и после их полета на МКС, показал, что длительное пребывание в космосе может провоцировать повреждение мозга.

12 октября
Алиса Гаджиева

Две тысячи лет назад многие сооружения строили лучше, чем сегодня.

27 сентября
Мария Азарова

Новое исследование генетиков из Германии и Италии, похоже, помогло найти ответ на вопрос, который занимал ученых свыше двух тысяч лет: откуда взялись этруски?

[miniorange_social_login]

Комментарии

3 Комментария

нaрод недaвно рaскрыл секрет стройного и подтянутого тела, не зaнимаясь спортом и без диет с помощью миостимулятора. Этот способ вычитaл в одном блоге и решил сразу же опробовать, результaт удивил: зa две недели убрал живот и начали проступать кубики, подкачал руки и спину.Тeпеpь и жeна захотeла пoпpобoвать, вeдь нe нужнo cидеть на диетaх и ходить в cпоpт зал и цена вoпpоca копeeчнaя. Вот тот блог, где подробно все описaно --- http://krati.co/blog
Кто-нибудь ещё помнит фильм где ИИ подделывало записи с камер наружного наблюдения что бы избавиться от неугодных кожаных мешков? Так вот, такое будущее всё ближе.
Подтвердить?
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: