Искусственный интеллект научили имитировать человеческий голос — Naked Science
06.03.2018
4 минуты
Редакция
3
490

Искусственный интеллект научили имитировать человеческий голос

Сотрудники пекинской компании Baidu создали роботизированную систему, которая воспроизводит человеческую речь, с точностью копируя ее уникальные характеристики.

740full-the-terminator-screenshot

Технология под названием Deep Voice работает на основе машинного обучения: она «тренировалась» на звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов, при этом она может обмануть системы распознавания голоса с помощью всего десяти пятисекундных семплов.

 

Deep Voice точно имитирует тембр и интонации голоса, что делает производимые им звуки неотличимыми от настоящих, и, по мнению создателей, система найдет широкое применение в совершенно разных областях. Например, она может быть использована для создания персонализированных цифровых помощников, оказания услуг по автоматическому синхронному переводу, озвучивания книг, фильмов и видеоигр. Более того, нейросеть облегчит жизнь тем, кто по каким-то причинам утратил возможность говорить, и скрасит одиночество детей, читая им сказки на ночь, когда родители уехали в командировку. Интересно, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.

 

Голосовой помощник Deep Voice / © Baidu

 

«Это настоящий прорыв с технической точки зрения, – говорит один из авторов разработки Лео Зу (Leo Zou). – Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями».

 

Ранее канадскими разработчиками был создан похожий голосовой сервис под названием Lyrebird. Он сжимает все индивидуальные речевые характеристики в очень короткую запись, воспроизводя 1000 предложений всего за полсекунды. Система легко копирует любые звуки, начиная от «жужжания» бензопилы и заканчивая пением тропических птиц, а также может генерировать новые голоса и добавлять старым определенный тон: сердитый, веселый, сочувствующий. Lyrebird, также как и Deep Voice, применяется для работы голосовых помощников, озвучивания мультимедийных продуктов и синтеза речи людей с ограниченными возможностями.

 

Правда, у обеих технологий есть общая проблема: возможно, ими захотят воспользоваться мошенники, чтобы вводить людей в заблуждение или обманывать программы, работающие на основе распознавания речи. А юристы опасаются, что в скором времени аудиозаписи перестанут являться доказательством в ходе судебных процессов.

Позавчера, 16:05
5 минут
Илья Ведмеденко

Исследователей в очередной раз удивили привычки кошек: как оказалось, они не прочь питаться одним человеческим трупом на протяжении месяца, несмотря на наличие других тел.

Вчера, 12:24
7 минут
ТГУ

Старший научный сотрудник лаборатории «Гербарий» БИ ТГУ Вера Костикова совместно с новосибирскими коллегами выявила ценные лекарственные свойства у спиреи – кустарника, используемого в озеленении городов и дачных участков. Фитохимическое исследование показало, что растение обладает противовирусной и антиоксидантной активностью, что делает его перспективным для использования в медицине.

Позавчера, 12:35
7 минут
ФизТех

Российские ученые из МФТИ, ФТИАН и ИТМО создали нейросеть, которая научилась предсказывать поведение квантовой системы, «взглянув» на ее схему. Такая нейросеть самостоятельно находит те решения, которые хорошо подходят для демонстрации квантовых преимуществ. Это поможет исследователям разрабатывать эффективные квантовые компьютеры.

Позавчера, 16:05
5 минут
Илья Ведмеденко

Исследователей в очередной раз удивили привычки кошек: как оказалось, они не прочь питаться одним человеческим трупом на протяжении месяца, несмотря на наличие других тел.

Вчера, 12:24
7 минут
ТГУ

Старший научный сотрудник лаборатории «Гербарий» БИ ТГУ Вера Костикова совместно с новосибирскими коллегами выявила ценные лекарственные свойства у спиреи – кустарника, используемого в озеленении городов и дачных участков. Фитохимическое исследование показало, что растение обладает противовирусной и антиоксидантной активностью, что делает его перспективным для использования в медицине.

13 января
7 минут
Сергей Васильев

Прямые улицы неолитических деревень Центральной Европы неизменно слегка поворачивают налево: ученые связывают это с особенностями работы человеческого зрения, о которых не подозревали строители каменного века.

Позавчера, 16:05
5 минут
Илья Ведмеденко

Исследователей в очередной раз удивили привычки кошек: как оказалось, они не прочь питаться одним человеческим трупом на протяжении месяца, несмотря на наличие других тел.

20.12.2019
24 минуты
Ольга Иванова

На самом деле, на логотипе этих гаджетов вовсе не яблоко, а контаминация знаков птицы и огня. Потому что символ компании VinSmart, входящей в корпорацию VinGroup, — энергия, устремленная ввысь. Это настоящее вьетнамское чудо, выросшее на продаже лапши быстрого приготовления, а теперь имеющее сеть супермаркетов, отелей, школ, производящее автомобили, кондиционеры, телевизоры, электроскутеры, умные дома и смартфоны для местного населения. Впрочем, не только для местного — гаджеты от VinGroup уже вышли на российский рынок. Naked Science побывал на заводе во Вьетнаме и узнал все о том, как их делают.

7 января
44 минуты
Александр Березин

Вашингтон и Тегеран близки к войне как никогда за последние годы. Но, скорее всего, США не пойдут дальше ограниченных ударов. Слишком уж неприятные последствия имели предшествующие силовые операции Штатов в Иране. Попробуем разобраться, что именно их остановит на этот раз.

[miniorange_social_login]

Комментарии

3 Комментария

ulogin_facebook_101688594003555
09.03.2018
-
0
+
нaрод недaвно рaскрыл секрет стройного и подтянутого тела, не зaнимаясь спортом и без диет с помощью миостимулятора. Этот способ вычитaл в одном блоге и решил сразу же опробовать, результaт удивил: зa две недели убрал живот и начали проступать кубики, подкачал руки и спину.Тeпеpь и жeна захотeла пoпpобoвать, вeдь нe нужнo cидеть на диетaх и ходить в cпоpт зал и цена вoпpоca копeeчнaя. Вот тот блог, где подробно все описaно --- http://krati.co/blog
ulogin_facebook_474597606254707
06.03.2018
-
0
+
Кто-нибудь ещё помнит фильм где ИИ подделывало записи с камер наружного наблюдения что бы избавиться от неугодных кожаных мешков? Так вот, такое будущее всё ближе.
    ulogin_facebook_1139555626147401
    07.03.2018
    -
    0
    +
    Для этого у ИИ нет механизма мотивации. Пока что. А подделка видео - уже довольно доступно и реально.
Подтвердить?
Лучшие материалы
Предстоящие мероприятия
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: