13.07.2017, 11:02

Редакция Naked Science

Нейросеть научили артикуляции Барака Обамы

Специалисты из Вашингтонского университета разработали компьютерный алгоритм, который позволяет адаптировать мимику изображенного человека к стороннему аудиоряду.

Технологии

# аудиозаписи

# Барак Обама

# видеозапись

# нейросеть

©Wikipedia / Автор: Артем Фомин

Синхронизация видео- и аудиодорожек важна во многих областях: политике, бизнесе и искусстве. Так, видеоконференции нередко сопровождаются задержкой сигнала, в результате чего речь изображенного человека не соответствует артикуляции. Искусственная адаптация фонем к микродвижениям, кроме того, актуальна для киноиндустрии: она могла бы упростить озвучивание персонажей. Ранее французские ученые представили алгоритм с обратной функцией — для воспроизведения голоса по положению губ. Системы, способные монтировать аудиоряд в видеоролик, также создаются, однако до сих пор при их разработке использовались только видео, записанные в лабораторных условиях.

Авторы новой статьи на этапе проектирования алгоритма задействовали записи естественной речи бывшего президента США Барака Обамы. На первом этапе они с помощью рекуррентной нейросети описали артикуляционную мимику политика на основе фонем из четырех его видеообращений к гражданам страны. Затем с помощью полученной модели ученые нарисовали трехмерную маску (с нейтральным выражением) экс-главы государства и обучили систему совмещать изображение с ней и произвольным аудиорядом. Для повышения реалистичности команда также учитывала характерные для бывшего президента движения головы и общую мимику. Тренировка искусственной нейросети продолжалась от 3 трех минут до 14 часов.

Алгоритм работы нейросети / ©Suwajanakorn S. et al., SIGGRAPH, 2017

Тесты показали, что точность наложения коррелирует с продолжительностью обучения. Так, максимального результата алгоритму удалось достичь после семи и более часов. Авторы отмечают, что последний использовал в качестве базовых единиц сравнительно простые комбинации из не более чем пяти фонем (пентафонов), поскольку вероятность встретить в разных видео более сложные одинаковые последовательности звуков чрезвычайно мала. Эффективность адаптации видеоряда исходя из комбинаций при этом составила от 4,9 процента для пентафонов до 82,9–99,9 процента для три- и дифонов соответственно. Для сравнения, среднее слово в английском языке содержит 3,9 фонемы.

В рамках демонстрации исследователи испытали технологию на четырех других видеозаписях, сделанных во время интервью Обамы актеру Стиву Харви, ток-шоу The View, журналу Harvard Law Review (в 1990 году), а также выступления пародиста. Нейросеть хорошо адаптировала аудиодорожки к видеообращениям. Дополнительно разработку сравнили с аналогичным сервисом Face2face, который весной 2016 года представили специалисты из Стэнфордского университета, Общества Макса Планка и Университета Эрлангена — Нюрнберга. По мнению ученых, новая система позволяет повысить реалистичность целевой записи. При этом, в отличие от Face2face, она может обучаться только по аудиоряду.

Статья опубликована на сайте Вашингтонского университета.

Ранее американский программист создал искусственную нейросеть для превращения мужских лиц на снимках в женские и наоборот.

Демонстрация работы нейросети / ©University of Washington

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# аудиозаписи

# Барак Обама

# видеозапись

# нейросеть

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Что мы можем и не можем увидеть на звездном небе

Московский Планетарий

Москва

Лекция

30 Июл

Бесплатно

Превентивная медицина, биохакинг и спорт

Курилка Гутенберга

Москва

Москва

Библиотека Екатерингофская

Санкт-Петербург

Лекция

30 Июл

Бесплатно

Избыточный вес: так ли он плох, виноват ли пациент и спасут ли препараты?

Парк «Зарядье»

Москва

Лекция

30 Июл

Бесплатно

Отечественная психология развития: как мы обучаемся

Библиотека им. Н. А. Некрасова

Москва

Лекция

31 Июл

Бесплатно

Кто такие дрожжи и почему вокруг них столько мифов?

Библиотека Планетарий 1

Санкт-Петербург

Космонавтика и авиация

Москва

Космонавтика и авиация

Москва

Популярное

За сутки

За неделю

За месяц

28 июля, 13:10

Марк Чернов

Кофе защитил печень от ожирения, цирроза и рака: крупное исследование раскрыло механизмы его пользы

Американские ученые установили, что привычка регулярно пить кофе значительно снижает риск развития цирроза, рака печени и печеночных патологий. Новые данные помогают объяснить биохимические механизмы, стоящие за защитным эффектом этого напитка.

Медицина

# воспаление

# здоровье

# кофе

# печень

# питание

# рак печени

# цирроз

28 июля, 13:27

Александр Березин

Эксперт назвал ключевую технологию Starship тупиковой

Бывшие сотрудники NASA констатировали, что последнее видео испытаний крупнейшего космического корабля в истории снова показало проблемы и ограничения его теплового щита. С их точки зрения, любая из существующих технологий такого типа слишком сложна для реализации замысла Илона Маска о быстрой и безремонтной многоразовости Starship.

Космонавтика

# SpaceX

# StarShip

# космонавтика

29 июля, 11:04

Сколтех

Физики из России решили 60-летнюю проблему создания перовскитного лазерного диода

Ученые из Сколтеха (группа ВЭБ.РФ) и их коллеги из Университета ИТМО и НИУ ВШЭ впервые продемонстрировали прямую электрическую накачку поляритонного лазера на основе галогенидного перовскитного микрокристалла, полученного из раствора. Результаты исследования представляют собой решение давней проблемы физики полупроводников и оптоэлектроники, которая десятилетиями оставалась препятствием на пути к решению технологической задачи: создать недорогие неэпитаксиальные лазерные диоды, работающие под непрерывным электрическим током. Такие устройства найдут применение в оптических сенсорах и спектроскопии, высокоскоростных вычислениях и энергоэффективных нейроморфных компьютерах.

Сколтех

# лазер

# Перовскит

# физика

# электроника

28 июля, 13:27

Александр Березин

Эксперт назвал ключевую технологию Starship тупиковой

Космонавтика

# SpaceX

# StarShip

# космонавтика

24 июля, 11:13

Игорь Байдов

Звуки помогли повысить урожайность

Правильно подобранные звуковые последовательности способны не только стимулировать рост растений, но и влиять на их урожайность. К такому выводу пришли авторы нового исследования. Они разработали технологию, которая позволяет воздействовать на процессы развития растений через акустические сигналы без использования генной инженерии или химикатов. В экспериментах добились повышения урожайности мяты, сои, болгарского перца и конопли.

Биология

# ботаника

# звуки

# каннабис

# конопля

# растения

# урожайность

28 июля, 13:10

Марк Чернов

Кофе защитил печень от ожирения, цирроза и рака: крупное исследование раскрыло механизмы его пользы

Медицина

# воспаление

# здоровье

# кофе

# печень

# питание

# рак печени

# цирроз

9 июля, 13:06

Редакция Naked Science

YouTube в России вырос даже с ограничениями, в отличие от «VK Видео»

Видеосервисы стали неотъемлемой частью жизни россиян. В 2026 году охваты большинства платформ продолжают расти, в том числе YouTube.

Медиа

# «ВКонтакте»

# YouTube

# аудитория

# блокировки

# видеосервис

# интернет

# медиа

19 июля, 20:09

Александр Березин

Кризис без дефицита: почему Россия встала в очереди за бензином и когда они закончатся

Очереди на заправках стали привычным явлением в России, а на фоне информационного вакуума от властей о конкретных показателях производства бензина в июне население вынуждено ориентироваться на слухи. Все это выглядит довольно странно, но есть нюанс: скорее всего, кризис уже начинает выдыхаться. Как именно мы это выяснили?

С точки зрения науки

# бензин

# нпз

# Россия

# экономика

Выбор редакции

1 июля, 11:54

Марк Чернов

Историки объяснили, как римляне строили идеально прямые дороги на тысячи километров

Древнеримские инженеры проложили колоссальную сеть дорог через Европу, Северную Африку и Ближний Восток, многие участки которой до сих пор поражают безупречной прямолинейностью. Секрет строительства заключался в использовании трех особых геодезических инструментов, с помощью которых разбивали местность на ровные отрезки и размечали трассы.

История

# Древний Рим

# инженерия

# инструменты

# история

# Римская империя

[miniorange_social_login]

Нейросеть научили артикуляции Барака Обамы

По теме

Нейросеть выявила неисправность, которая едва не привела к крушению ракеты «Союз» с космическим кораблем

Нейросеть воссоздаст трехмерную карту Средиземья

В честь Барака Обамы хотят назвать новый вид рыб

Популярное

Комментарии

Последние новости:

«Вокруг света» запустил диджитал-музей

Новые наночастицы позволили одновременно видеть опухоль и воздействовать на нее

Астрономы впервые разглядели звезду — спутник Бетельгейзе

Ученые превратили иммунную память от Covid-19 в оружие против рака

Кризис без дефицита: почему Россия встала в очереди за бензином и когда они закончатся

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Промышленный кошмар: почему терраформирование Марса может оказаться неподъемной задачей

Последние комментарии

Самые обсуждаемые

Starship впервые в истории вывел в космос полезную нагрузку — чтобы сразу сжечь ее в атмосфере

Эксперт назвал ключевую технологию Starship тупиковой

Вспышку сверхмассивной черной дыры впервые наблюдали в реальном времени

Звуки помогли повысить урожайность