Nvidia показала нейросеть, превращающую простые скетчи в фотореалистичные изображения
Искусственный интеллект способен преобразовывать наброски за секунды.
С 18 по 21 марта в Калифорнии проходит конференция GTC 2019, организованная компанией Nvidia. На ней представители американского производителя графических процессоров продемонстрировали искусственный интеллект, который за секунды обрабатывает схематичный набросок и превращает его в фотореалистичное изображение.
Нейросеть носит название GauGAN, которое она получила в честь живописца Поля Гогена, чьи работы относят к направлению постимпрессионизма. Она представляет собой генеративно-состязательную сеть (GAN). В нее входит две сети, которые называют генератором и дискриминатором. Генератор создает изображение, а дискриминатор, обученный на реальных фотографиях, подсказывает, как его необходимо исправить.
Интерфейс приложения состоит из трех инструментов: кисти, карандаша и заливки. Помимо них, доступны различные текстуры — от неба до камней и деревьев. Достаточно выбрать нужную текстуру, задать форму, залить, и нейросеть сама создаст на ее месте реалистичный объект.
Для тренировки искусственного интеллекта (ИИ) использовали один миллион фотографий, большую часть которых взяли с портала Flickr. Вице-президент по прикладным исследованиям в области ИИ Брайан Катандзаро (Bryan Catanzaro) заверил, что они соблюдали авторское право.
Создатели отмечают, что нейросеть способна менять время суток и времена года. К примеру, если указать зиму, то изменится не только ландшафт, который теперь покроется снегом, но и небо — оно станет облачным и серым. То же касается и деревьев, которые скинут листья. При этом GauGAN понимает, когда объекты стоят перед водной гладью, и отражает их там. Алгоритм мультимодальный: даже по двум одинаковым эскизам он создаст два отличающихся изображения.
Во время демонстрации программа производила все процессы за секунды в режиме реального времени. Брайан Катандзаро сказал, что такие результаты получились благодаря графическому процессору Titan. Однако, по его словам, с некоторыми доработками алгоритм сможет работать практически на любой платформе, но процесс преобразования займет больше времени.
Пока GauGAN работает только с объектами природы, но авторы не исключают возможности натренировать алгоритм на отображение зданий, дорог, людей и других элементов реальности. По мнению Катандзаро, этот инструмент пригодится ландшафтным дизайнерам, архитекторам и всем тем, кто связан с созданием виртуальных миров. Он надеется, что демоверсия скоро появится на сайте Nvidia — AI Playground, который компания также представила на GTC 2019.
Вы можете пройти наш тест, который проверит, способны ли вы определить, где сгенерированный портрет, а где — фотография реального человека.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Во всем мире во всех человеческих культурах около 90% людей пользуются преимущественно правой рукой. Такое поразительное единство практически всего человечества не имеет аналогов среди приматов и до сих пор остается эволюционной загадкой. Ученые проанализировали данные о более чем двух тысячах человекообразных обезьянах и выяснили, когда и почему праворукость стала популяционной тенденцией.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Выходя из вагона и направляясь к выходу со станции, люди склонны следовать по тому же маршруту, что и незнакомый человек, идущий непосредственно перед ними. Это происходит даже в том случае, если такой выбор приводит к увеличению времени в пути.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии