• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
13.07.2017
Редакция Naked Science
1
228

Нейросеть научили артикуляции Барака Обамы

Специалисты из Вашингтонского университета разработали компьютерный алгоритм, который позволяет адаптировать мимику изображенного человека к стороннему аудиоряду.

giphy_4
©Wikipedia / Автор: Артем Фомин

Синхронизация видео- и аудиодорожек важна во многих областях: политике, бизнесе и искусстве. Так, видеоконференции нередко сопровождаются задержкой сигнала, в результате чего речь изображенного человека не соответствует артикуляции. Искусственная адаптация фонем к микродвижениям, кроме того, актуальна для киноиндустрии: она могла бы упростить озвучивание персонажей. Ранее французские ученые представили алгоритм с обратной функцией — для воспроизведения голоса по положению губ. Системы, способные монтировать аудиоряд в видеоролик, также создаются, однако до сих пор при их разработке использовались только видео, записанные в лабораторных условиях.

 

Авторы новой статьи на этапе проектирования алгоритма задействовали записи естественной речи бывшего президента США Барака Обамы. На первом этапе они с помощью рекуррентной нейросети описали артикуляционную мимику политика на основе фонем из четырех его видеообращений к гражданам страны. Затем с помощью полученной модели ученые нарисовали трехмерную маску (с нейтральным выражением) экс-главы государства и обучили систему совмещать изображение с ней и произвольным аудиорядом. Для повышения реалистичности команда также учитывала характерные для бывшего президента движения головы и общую мимику. Тренировка искусственной нейросети продолжалась от 3 трех минут до 14 часов.

 

Алгоритм работы нейросети / ©Suwajanakorn S. et al., SIGGRAPH, 2017

 

Тесты показали, что точность наложения коррелирует с продолжительностью обучения. Так, максимального результата алгоритму удалось достичь после семи и более часов. Авторы отмечают, что последний использовал в качестве базовых единиц сравнительно простые комбинации из не более чем пяти фонем (пентафонов), поскольку вероятность встретить в разных видео более сложные одинаковые последовательности звуков чрезвычайно мала. Эффективность адаптации видеоряда исходя из комбинаций при этом составила от 4,9 процента для пентафонов до 82,9–99,9 процента для три- и дифонов соответственно. Для сравнения, среднее слово в английском языке содержит 3,9 фонемы.

 

В рамках демонстрации исследователи испытали технологию на четырех других видеозаписях, сделанных во время интервью Обамы актеру Стиву Харви, ток-шоу The View, журналу Harvard Law Review (в 1990 году), а также выступления пародиста. Нейросеть хорошо адаптировала аудиодорожки к видеообращениям. Дополнительно разработку сравнили с аналогичным сервисом Face2face, который весной 2016 года представили специалисты из Стэнфордского университета, Общества Макса Планка и Университета Эрлангена — Нюрнберга. По мнению ученых, новая система позволяет повысить реалистичность целевой записи. При этом, в отличие от Face2face, она может обучаться только по аудиоряду.

 

Статья опубликована на сайте Вашингтонского университета.

 

Ранее американский программист создал искусственную нейросеть для превращения мужских лиц на снимках в женские и наоборот.

 

Демонстрация работы нейросети / ©University of Washington

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Вчера, 14:07
Юлия Трепалина

Канадские исследователи на крупной выборке людей показали, что взросление в семье с несколькими детьми может способствовать развитию таких качеств, как честность и стремление к сотрудничеству.

Вчера, 12:14
Елизавета Александрова

Астрономы обнаружили, что всего в 42 световых годах от нас, вокруг оранжевой карликовой звезды, обращаются планеты, похожие друг на друга почти как братья-близнецы. Все они в диаметре — вылитая Земля, но в несколько раз тяжелее. Почему?

Вчера, 12:18
Березин Александр

Утечки в западной прессе показали, что администрация Дональда Трампа запланировала ликвидировать «священных коров» американского лоббизма — ракету и корабль общей стоимостью 40 миллиардов долларов. Ранее полет на Луну к 2027 году задумывали именно с их участием. Несмотря на свертывание обеих программ, планы по освоению космоса стали еще амбициознее.

22 декабря
Андрей

Американские специалисты изучили больше двух тысяч ископаемых раковин моллюсков неогенового периода и обнаружили среди них уникальные свидетельства неудачной охоты. Две раковины зияли отверстиями, которые хищные улитки просверлили изнутри, то есть их добыча была уже мертвой. Это первые подобные наблюдения, и причин у древних ошибок могло быть несколько: палеонтологи не исключают, что брюхоногие «напали» на пустые раковины с голоду.

23 декабря
Елизавета Александрова

До сих пор многие ученые считали, что у лунной воды два источника происхождения: немалая доля доставлена с упавшими кометами, но большая часть образовалась на самой Луне под действием частиц солнечного ветра. По итогам недавнего исследования планетологи вынуждены перечеркнуть эту картину. Они заявили, что кометная вода на естественном спутнике Земли действительно есть, но радиация вряд ли сыграла значительную роль. Вместо этого, похоже, главная часть лунной воды происходит из того же материала, из которого сформировалась наша планета.

23 декабря
Андрей

Группа антропологов проанализировала более 800 часов видеозаписей, собранных в течение 25 лет наблюдений за небольшой группой шимпанзе в Гвинее. Ученые решили выяснить, различаются ли подходы к добыче пищи у приматов одного сообщества. Оценив их действия по ряду критериев, исследовали обнаружили множество индивидуальных различий в колке орехов: некоторые шимпанзе справлялись значительно быстрее сородичей. Вдобавок выяснилось, что эти обезьяны оттачивают навыки вдвое дольше, чем считалось.

28 ноября
Елизавета Александрова

Обсерватории постоянно улавливают «мигающие» радиосигналы из глубин Вселенной. Чаще всего их источниками оказываются нейтронные звезды, которые за это и назвали пульсарами. Но к недавно обнаруженному источнику GLEAM-X J0704-37 они, по мнению астрономов, отношения не имеют.

3 декабря
Елизавета Александрова

Американская лунная программа «Артемида» предусматривает экспедиции длительностью от нескольких дней до долгих недель и даже месяцев, но луномобиля для передвижения экипажа по поверхности спутника Земли на сегодня нет. Поэтому космическое агентство США продумывает план действий на случай, если астронавты окажутся далеко от базы и кто-то из них внезапно не сможет идти самостоятельно.

13 декабря
Юлия Трепалина

С какого возраста зооврачи считают собак престарелыми? Это недавно выяснили исследователи из Великобритании и Венгрии, проанализировав карты пациентов ветеринарных клиник. Также ученые установили, от каких проблем со здоровьем чаще страдают пожилые питомцы.

[miniorange_social_login]

Комментарии

1 Комментарий
rexerect
14.07.2017
-
0
+
Очень круто! Поскорей бы увидеть это в компьютерных играх
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно