• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
13.07.2017
Редакция Naked Science
1
191

Нейросеть научили артикуляции Барака Обамы

Специалисты из Вашингтонского университета разработали компьютерный алгоритм, который позволяет адаптировать мимику изображенного человека к стороннему аудиоряду.

giphy_4
©Wikipedia

Синхронизация видео- и аудиодорожек важна во многих областях: политике, бизнесе и искусстве. Так, видеоконференции нередко сопровождаются задержкой сигнала, в результате чего речь изображенного человека не соответствует артикуляции. Искусственная адаптация фонем к микродвижениям, кроме того, актуальна для киноиндустрии: она могла бы упростить озвучивание персонажей. Ранее французские ученые представили алгоритм с обратной функцией — для воспроизведения голоса по положению губ. Системы, способные монтировать аудиоряд в видеоролик, также создаются, однако до сих пор при их разработке использовались только видео, записанные в лабораторных условиях.

 

Авторы новой статьи на этапе проектирования алгоритма задействовали записи естественной речи бывшего президента США Барака Обамы. На первом этапе они с помощью рекуррентной нейросети описали артикуляционную мимику политика на основе фонем из четырех его видеообращений к гражданам страны. Затем с помощью полученной модели ученые нарисовали трехмерную маску (с нейтральным выражением) экс-главы государства и обучили систему совмещать изображение с ней и произвольным аудиорядом. Для повышения реалистичности команда также учитывала характерные для бывшего президента движения головы и общую мимику. Тренировка искусственной нейросети продолжалась от 3 трех минут до 14 часов.

 

Алгоритм работы нейросети / ©Suwajanakorn S. et al., SIGGRAPH, 2017

 

Тесты показали, что точность наложения коррелирует с продолжительностью обучения. Так, максимального результата алгоритму удалось достичь после семи и более часов. Авторы отмечают, что последний использовал в качестве базовых единиц сравнительно простые комбинации из не более чем пяти фонем (пентафонов), поскольку вероятность встретить в разных видео более сложные одинаковые последовательности звуков чрезвычайно мала. Эффективность адаптации видеоряда исходя из комбинаций при этом составила от 4,9 процента для пентафонов до 82,9–99,9 процента для три- и дифонов соответственно. Для сравнения, среднее слово в английском языке содержит 3,9 фонемы.

 

В рамках демонстрации исследователи испытали технологию на четырех других видеозаписях, сделанных во время интервью Обамы актеру Стиву Харви, ток-шоу The View, журналу Harvard Law Review (в 1990 году), а также выступления пародиста. Нейросеть хорошо адаптировала аудиодорожки к видеообращениям. Дополнительно разработку сравнили с аналогичным сервисом Face2face, который весной 2016 года представили специалисты из Стэнфордского университета, Общества Макса Планка и Университета Эрлангена — Нюрнберга. По мнению ученых, новая система позволяет повысить реалистичность целевой записи. При этом, в отличие от Face2face, она может обучаться только по аудиоряду.

 

Статья опубликована на сайте Вашингтонского университета.

 

Ранее американский программист создал искусственную нейросеть для превращения мужских лиц на снимках в женские и наоборот.

 

Демонстрация работы нейросети / ©University of Washington

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Вчера, 13:12
Ольга Иванова

Исследователи из Швеции и Великобритания узнали, что «правило деревьев» да Винчи, который считал, что толщина всех веток дерева на любой его высоте, сложенная вместе, равна толщине ствола, ошибочно на микроуровне.

Вчера, 18:00
Алиса Гаджиева

Древние представители рода Homo жили около водопада Каламбо в Южной Африке 476 тысяч лет назад. К такому выводу пришли британские ученые, рассказавшие о самом раннем случае обработки древесины в строительных целях.

Вчера, 08:41
Михаил Орлов

Обнаруженные в Китае остатки нижней челюсти причудливо сочетают признаки древних и современных людей. Антропологи сравнили их с другими гомининами, жившими примерно в то же время, и сделали вывод, что речь может идти о неизвестной ветке родословной людей.

18 сентября
JuliaT

Людям, работающим посменно, студентам во время сессии и молодым родителям часто приходится не спать по ночам. Новое исследование показало, что усталость и сонливость после вынужденного бдения можно побороть с помощью специальной стратегии отдыха.

Вчера, 13:12
Ольга Иванова

Исследователи из Швеции и Великобритания узнали, что «правило деревьев» да Винчи, который считал, что толщина всех веток дерева на любой его высоте, сложенная вместе, равна толщине ствола, ошибочно на микроуровне.

Вчера, 18:00
Алиса Гаджиева

Древние представители рода Homo жили около водопада Каламбо в Южной Африке 476 тысяч лет назад. К такому выводу пришли британские ученые, рассказавшие о самом раннем случае обработки древесины в строительных целях.

31 августа
Сергей Васильев

Вопреки предсказаниям, кислород-28 оказался крайне неустойчивым. Физики не успели даже зарегистрировать такие ядра, хотя теоретически они должны быть дважды магическими, а значит — особенно стабильными.

31 августа
Дарья Губина

Тотальная память — плохо для мозга. Чтобы детально запомнить событие, стоит о нем вспоминать как можно реже. Чем больше вы знаете по теме, тем больше новой информации вы запомните. Но если информации будет слишком много, то не вся она будет зафиксирована в мозге. Naked Science разбирается, как сегодня ученые, нейробиологи и психологи объясняют способности нашего мозга запоминать и учиться.

24 августа
Сергей Васильев

Двадцать лет спустя после завершения проекта «Геном человека» ученые продолжают восполнять оставленные им пробелы. Недавно им удалось установить последовательность мужской половой хромосомы, особенно трудной для секвенирования.

[miniorange_social_login]

Комментарии

1 Комментарий

rexerect
14.07.2017
-
0
+
Очень круто! Поскорей бы увидеть это в компьютерных играх
Подтвердить?
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: