05.09.2024, 11:00

НИУ ВШЭ

В НИУ ВШЭ разработали метод высококачественного редактирования изображений

❋ 4.4

Исследователи Центра ИИ НИУ ВШЭ, AIRI и Бременского университета разработали новый метод редактирования изображений на основе глубинного обучения — StyleFeatureEditor. Он позволяет точно воссоздавать мельчайшие детали изображения и сохранять их при редактировании. С его помощью пользователи смогут изменять цвет волос или выражение лица без потери качества изображения.

НИУ ВШЭ

# изображения

# искусственный интеллект

# машинное обучение

# редактирование

# фотографии

Сравнение работы StyleFeatureEditor (SFE) с другими методами на наборе лиц с большим числом деталей / © Denis Bobkov, Vadim Titov, Aibek Alanov, Dmitry Vetrov; Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2024, pp. 9337-9346

Результаты работы опубликованы на самой цитируемой конференции по компьютерному зрению CVPR 2024. Искусственный интеллект уже научился генерировать изображения и редактировать их. Это стало возможным благодаря генеративно-состязательным нейросетям (GANs — generative adversarial networks). Архитектура предполагает две независимые сети: генератор производит изображения, дискриминатор различает реальные и сгенерированные образцы, и они соревнуются друг с другом. Новым этапом в развитии генеративно-состязательных сетей стала модель StyleGAN. Она может генерировать изображения и изменять их отдельные части по запросу пользователя, но не умеет работать с реальными фото или картинками.

Исследователи Центра ИИ НИУ ВШЭ, AIRI и Бременского университета предложили способ быстро и качественно редактировать реальные изображения. Ученые создали метод (StyleFeatureEditor) с двумя модулями: первый воссоздает (реконструирует) исходное изображение, а второй редактирует эту реконструкцию. Результат работы модулей передается в StyleGAN в понятном для нейросети наборе внутренних представлений, из которых и создается редактированное изображение. При этом разработчикам удалось решить проблемы, которые возникали в предыдущих исследованиях: при небольшом наборе представлений нейросеть хорошо редактировала изображение, но теряла детали исходного изображения, а при большом наборе все детали сохранялись, но нейросеть не понимала, как их правильно преобразовать с учетом поставленной задачи.

Для решения этой проблемы исследователи предложили следующее: первый модуль ищет и большие, и маленькие представления, а второй учится редактировать большие на примере редактуры маленьких представлений. Однако, чтобы обучить эти модули правильно редактировать представления, нейросети нужны настоящие изображения и их отредактированные версии.

«Нам нужны были образцы, например одно и то же лицо с разной мимикой, прической, деталями. К сожалению, таких пар изображений не существует на данный момент. И мы придумали хитрость: с помощью метода, работающего с малыми представлениями, мы создали реконструкцию настоящего изображения и пример редактирования этой реконструкции. Несмотря на то что получились довольно простые примеры без деталей, модель четко поняла, как правильно совершать редактирования», — рассказывает один из авторов статьи, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН ВШЭ, младший научный сотрудник лаборатории Fusion Brain AIRI Денис Бобков.

Однако обучение только на сгенерированных (простых) примерах ведет к потере деталей при работе с реальными (сложными) изображениями. Чтобы этого не происходило, ученые добавили реальные изображения в обучающую выборку. И нейросеть училась воссоздавать их в деталях.

Таким образом, показав модели и как редактировать простые, и как воссоздавать сложные изображения, ученым удалось создать условия, при которых нейросеть научилась редактировать сложные изображения. В частности, разработанный подход справляется с добавлением новых элементов стиля, а также лучше сохраняет детали исходных изображений по сравнению с другими существующими методами.

В случае простой реконструкции (первый ряд) StyleFeatureEditor аккуратно воспроизвел шляпку, в то время как большинство других методов ее практически потеряло. Лучшее качество разработанный метод показал в случае добавления аксессуаров (третий ряд): большинство методов справились с добавлением очков, но только StyleFeatureEditor сохранил исходный цвет глаз.

«Благодаря технике обучения на сгенерированных данных, мы получили модель с хорошим качеством редактирования, а также быструю скорость работы за счет использования подхода с достаточно легковесными нейросетями. Фреймворку StyleFeatureEditor требуется всего 0,07 секунды на редактирование одного изображения», — говорит Айбек Аланов, заведующий Центром глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН ВШЭ, руководитель научной группы «Контролируемый генеративный ИИ» лаборатории Fusion Brain AIRI.

Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве России. Результаты исследования будут представлены в докладе на ежегодной конференция по искусственному интеллекту и машинному обучению Fall into ML 2024, которая пройдет в НИУ ВШЭ 25-26 октября. На площадке Высшей школы экономики ведущие ученые в области искусственного интеллекта обсудят лучшие работы, опубликованные на конференциях А* в 2024 году — флагманских событиях этой области. Демо разработанного метода можно опробовать на HuggingFace, код — в Github репозитории.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# изображения

# искусственный интеллект

# машинное обучение

# редактирование

# фотографии

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

20 Авг

Бесплатно

Русское зарубежье и советские граждане в Движении Сопротивления

Библиотека иностранной литературы

Москва

Лекция

20 Авг

700 ₽

Неожиданная биология: ключевые открытия июля

Центр «Архэ»

Онлайн

Лекция

20 Авг

Бесплатно

Пять принципов здоровья

ВДНХ

Москва

Лекция

20 Авг

Бесплатно

О хвостиках, ушках и лапках. Собаки в космосе

Космонавтика и авиация

Москва

Лекция

21 Авг

Бесплатно

Зоопарки Юго-Восточной Азии: оазисы биоразнообразия

Московский зоопарк

Москва

Космонавтика и авиация

Москва

Лекция

21 Авг

Бесплатно

Эволюция технологий искусственного интеллекта: от генеративных моделей к интерактивным системам

Курилка Гутенберга

Москва

Экскурсия

22 Авг

800 ₽

Сохранить для потомков: здание Политехнического музея в годы войны

Политехнический музей

Москва

Популярное

За сутки

За неделю

За месяц

19 августа, 15:54

Елена Авдеева

Биологи выяснили, почему буревестники справляют нужду только в полете

К любопытным выводам привели наблюдения японских ученых за пестролицыми буревестниками. Оказалось, эти птицы испражняются в основном на лету, намеренно избегая такой возможности на поверхности воды. Очевидно, предположили исследователи, это облегчает движения в воздухе взрослым особям с добычей во рту.

Биология

# гуано

# дефекация

# морские птицы

# Тихий океан

# экосистемы

19 августа, 12:09

Елена Авдеева

Колония микробов помогла получить шоколад высшей пробы

Биотехнологи из Ноттингемского университета (Великобритания) воспроизвели процесс естественной ферментации какао-бобов в лаборатории, чтобы проверить, можно ли улучшить вкус готового продукта «вручную». Оказалось, что правильно подобранная колония микроорганизмов может внести свои нотки и определить качество будущего шоколада.

Химия

# бактерии

# биотехнологии

# какао

# микроорганизмы

# ферментация

19 августа, 21:25

Evgenia Vavilova

Физики создали бескомпромиссный горячий кубит

Исследователям квантовых компьютеров обычно приходится выбирать: сделать стабильный кубит или быстрый. Международная группа ученых нашла способ создать кубиты, избавленные от этой необходимости.

Физика

# дырки

# квантовые вычесления

# кубит

# спин-орбитали

# Спинтроника

16 августа, 19:09

Адель Романова

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Астрономы подсчитали, что с поверхности летящего по Солнечной системе межзвездного объекта 3I/ATLAS каждую секунду испаряется около 40 килограммов водяного льда. Такую сильную кометную активность он проявил, будучи в три с половиной раза дальше Земли от Солнца. По мнению ученых, это довольно необычно.

Астрономия

# кометы

# космос

# межзвездная комета

# межзвездные объекты

# Солнечная система

18 августа, 11:11

Денис Яковлев

Ученые прочитали мысли с рекордной точностью

За последнее десятилетие ученые создали несколько сложных систем «мозг — компьютер», которые позволяли преобразовывать мозговую активность людей, лишившихся способности говорить из-за различных заболеваний, в речь. Однако до сих пор удавалось расшифровать лишь небольшое количество слов. Теперь в США создали алгоритм, благодаря которому удалось распознать до 54 процентов «речи».

Медицина

# имплантация

# интерфейс мозг-компьютер

# нейробиология

# речь

15 августа, 08:25

Любовь С.

Астрономы объяснили природу «Ока Саурона», которое «смотрит» на Землю

Изображение блазара PKS 1424+240, полученное с помощью радиоинтерферометра VLBA, напомнило астрономам легендарное «Око Саурона» из «Властелина колец» — джет, пронизывающий кольцеобразное магнитное поле объекта, устремлен к нашей планете, а сам блазар может оказаться одним из наиболее ярких источников нейтрино в космосе.

Астрономия

# блазары

# джет

# космические лучи

# нейтрино

# радиоастрономия

# сверхмассивные черные дыры

25 июля, 07:47

Адель Романова

У третьего межзвездного объекта нашли признаки управляемого корабля

Прибывшая из межзвездного пространства предполагаемая комета 3I/ATLAS движется по траектории, максимально удобной для гравитационных маневров управляемого корабля, при этом возможность ее отслеживания с Земли практически минимальна. По мнению некоторых ученых, такое «поведение» объекта наводит на определенные мысли.

Астрономия

# внеземные цивилизации

# космос

# межзвездная комета

# межзвездные зонды

# межзвездные объекты

6 августа, 20:59

Татьяна Пичугина

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.

Геология

# Атлантический океан

# комета

# морское дно

# платина

# событие позднего дриаса

22 июля, 14:44

ФизТех

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.

ФизТех

# ChatGPT

# нейросети

# ошибки

# слова

# текст

[miniorange_social_login]

В НИУ ВШЭ разработали метод высококачественного редактирования изображений

По теме

Ученые придумали, как ускорить сетевой искусственный интеллект

Как искусственный интеллект спасет отечественное ЖКХ

Искусственный интеллект создал новый материал

Популярное

Биологи выяснили, почему буревестники справляют нужду только в полете

Колония микробов помогла получить шоколад высшей пробы

Физики создали бескомпромиссный горячий кубит

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Ученые прочитали мысли с рекордной точностью

Астрономы объяснили природу «Ока Саурона», которое «смотрит» на Землю

У третьего межзвездного объекта нашли признаки управляемого корабля

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Бозон Хиггса: одно из самых важных открытий в науке

Семь самых необычных патентов Google

Из чего состоят экзопланеты и откуда мы это знаем

Самые «горячие» премьеры Женевы

«Багратион»: удар Красной армии, который удивил даже Красную армию

В прекрасное далеко на поезде

Машины Вселенной: незримое население космоса?

Силы света: как путешествовать через вещество?

В НИУ ВШЭ разработали метод высококачественного редактирования изображений

По теме

Ученые придумали, как ускорить сетевой искусственный интеллект

Как искусственный интеллект спасет отечественное ЖКХ

Искусственный интеллект создал новый материал

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?