Искусственный интеллект научили имитировать человеческий голос — Naked Science
06.03.2018
4 минуты
Редакция
3

Искусственный интеллект научили имитировать человеческий голос

Сотрудники пекинской компании Baidu создали роботизированную систему, которая воспроизводит человеческую речь, с точностью копируя ее уникальные характеристики.

740full-the-terminator-screenshot

Технология под названием Deep Voice работает на основе машинного обучения: она «тренировалась» на звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов, при этом она может обмануть системы распознавания голоса с помощью всего десяти пятисекундных семплов.

 

Deep Voice точно имитирует тембр и интонации голоса, что делает производимые им звуки неотличимыми от настоящих, и, по мнению создателей, система найдет широкое применение в совершенно разных областях. Например, она может быть использована для создания персонализированных цифровых помощников, оказания услуг по автоматическому синхронному переводу, озвучивания книг, фильмов и видеоигр. Более того, нейросеть облегчит жизнь тем, кто по каким-то причинам утратил возможность говорить, и скрасит одиночество детей, читая им сказки на ночь, когда родители уехали в командировку. Интересно, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.

 

Голосовой помощник Deep Voice / © Baidu

 

«Это настоящий прорыв с технической точки зрения, – говорит один из авторов разработки Лео Зу (Leo Zou). – Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями».

 

Ранее канадскими разработчиками был создан похожий голосовой сервис под названием Lyrebird. Он сжимает все индивидуальные речевые характеристики в очень короткую запись, воспроизводя 1000 предложений всего за полсекунды. Система легко копирует любые звуки, начиная от «жужжания» бензопилы и заканчивая пением тропических птиц, а также может генерировать новые голоса и добавлять старым определенный тон: сердитый, веселый, сочувствующий. Lyrebird, также как и Deep Voice, применяется для работы голосовых помощников, озвучивания мультимедийных продуктов и синтеза речи людей с ограниченными возможностями.

 

Правда, у обеих технологий есть общая проблема: возможно, ими захотят воспользоваться мошенники, чтобы вводить людей в заблуждение или обманывать программы, работающие на основе распознавания речи. А юристы опасаются, что в скором времени аудиозаписи перестанут являться доказательством в ходе судебных процессов.

Позавчера, 20:14
7 минут
Полина Гершберг

Клеточные линии человека с «лицом эльфа» помогли ученым подтвердить, что древние люди одомашнили сами себя.

Вчера, 14:09
4 минуты
Илья Ведмеденко

Исследователи полагают, что усваивание алкоголя, возможно, позволило предкам человека разумного возвыситься над другими видами.

Вчера, 13:16
2 минуты
Илья Ведмеденко

Российское телевидение показало, что находится внутри так называемого ядерного чемоданчика — устройства, содержащего коды, которые в случае необходимости должны привести в действие ядерный арсенал страны.

4 декабря
39 минут
Александр Березин

В 2017 году от рака умерло 9,6 миллиона человек, и с каждым годом эта цифра будет расти. Есть ли способы остановить наступление этой болезни на человеческие жизни?

4 декабря
2 минуты
Илья Ведмеденко

По мнению информаторов Центрального разведывательного управления США, СССР мог располагать огромным танком массой в 120 тонн.

Позавчера, 20:14
7 минут
Полина Гершберг

Клеточные линии человека с «лицом эльфа» помогли ученым подтвердить, что древние люди одомашнили сами себя.

15 ноября
6 минут
Никита Шевцов

Ученые впервые воспроизвели в реальности парадокс друга Вигнера. В результате физики выяснили, что квантовые явления субъективны: каждый наблюдатель может иметь свои альтернативные факты насчет них, и все они будут правдивы.

18 ноября
4 минуты
Сергей Васильев

Накопление эпигенетических модификаций ДНК позволило провести параллели между возрастом собак и людей и найти новую формулу для пересчета одного в другой.

19 ноября
40 минут
Александр Березин

Женщины заводят ребенка не от мужа тем чаще, чем ниже его социальная ценность. Попробуем разобраться, как биология подталкивает их к изменам и почему моногамия имеет все шансы на реванш.

[miniorange_social_login]

Комментарии

3 Комментария

ulogin_facebook_101688594003555
11:30
-
0
+
нaрод недaвно рaскрыл секрет стройного и подтянутого тела, не зaнимаясь спортом и без диет с помощью миостимулятора. Этот способ вычитaл в одном блоге и решил сразу же опробовать, результaт удивил: зa две недели убрал живот и начали проступать кубики, подкачал руки и спину.Тeпеpь и жeна захотeла пoпpобoвать, вeдь нe нужнo cидеть на диетaх и ходить в cпоpт зал и цена вoпpоca копeeчнaя. Вот тот блог, где подробно все описaно --- http://krati.co/blog
ulogin_facebook_474597606254707
11:30
-
0
+
Кто-нибудь ещё помнит фильм где ИИ подделывало записи с камер наружного наблюдения что бы избавиться от неугодных кожаных мешков? Так вот, такое будущее всё ближе.
    ulogin_facebook_1139555626147401
    11:30
    -
    0
    +
    Для этого у ИИ нет механизма мотивации. Пока что. А подделка видео - уже довольно доступно и реально.
Подтвердить?
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: