28.02.2023, 11:00

НИУ ВШЭ

В НИУ ВШЭ научили нейросеть учиться на несколько порядков эффективнее

❋ 4.6

Нейросетевые генеративные модели в последние годы достигли впечатляющих результатов, однако важной задачей остается повышение эффективности их работы. Исследователям факультета компьютерных наук НИУ ВШЭ и Института искусственного интеллекта AIRI удалось оптимизировать обучение нейросети StyleGAN2, создающей реалистичные картинки, сократив число обучаемых параметров на четыре порядка. При этом качество полученных изображений осталось высоким.

НИУ ВШЭ

# генератор

# изображение

# нейросеть

# обучение

# портрет

Сравнение предложенного подхода с основным бейзлайном (StyleGAN-NADA). Методы показывают сопоставимое визуальное качество, притом, что предложенный подход имеет на порядки меньше обучаемых параметров / ©Пресс-служба НИУ ВШЭ / Автор: Milonia Larcius

Результаты работы представлены в докладе на конференции NeurIPS 2022. Современные модели умеют генерировать человеческие лица в таком качестве, что их не отличить от лиц настоящих людей, и в то же время эти лица — новые, то есть таких людей в мире никогда не существовало. Одним из многообещающих типов генеративных моделей стала GAN (Generative Adversarial Network) — генеративно-состязательная сеть. Это комбинация из двух нейронных сетей, одна из которых (генератор) производит образцы, а другая (дискриминатор) — старается отличить правильные образцы от неправильных. Так как генератор и дискриминатор имеют противоположные цели, между ними возникает антагонистическая игра, которая способствует быстрому достижению общей цели — созданию реалистичного изображения.

Основная проблема при обучении генеративных моделей — сбор большого количества изображений высокого качества. Для того чтобы научиться генерировать реалистичные лица в высоком разрешении, сети понадобится порядка 100 тысяч разнообразных лиц. К сожалению, собрать такой датасет сложно, особенно в некоторых ситуациях, когда, например, нужно получить портреты в стиле конкретного художника или персонажей из вселенной Pixar.

Слева: предложенная доменная модуляция и ее механизм в архитектуре StyleGAN2. Справа: механизм доменной адаптации с помощью обучения доменных векторов / ©Пресс-служба НИУ ВШЭ

Однако даже в экстремальных случаях, когда доступно несколько примеров стилизованных изображений или только текстовые описания, есть методы для дообучения генеративной модели, которая изначально училась на большом датасете обычных изображений. «Ранее для адаптации генератора под новый домен (например, портреты в стиле Pixar) дообучали почти все параметры — это порядка 30 миллионов. Нашей целью было уменьшить их число, так как мы понимали, что не имеет смысла учить заново весь генератор, чтобы изменить только стиль созданного ранее изображения», — отметил Дмитрий Ветров, заведующий Центром глубинного обучения и байесовских методов НИУ ВШЭ и ведущий научный сотрудник AIRI.

В статье HyperDomainNet: Universal Domain Adaptation for Generative Adversarial Networks ученые Центра глубинного обучения и байесовских методов НИУ ВШЭ описали новый подход к дообучению генеративной модели StyleGAN2. Это генеративная нейросеть, которая преобразует случайный шум в реалистичную картинку. Исследователям удалось оптимизировать ее обучение, сократив число обучаемых параметров (весов) на четыре порядка за счет обучения дополнительного доменного вектора.

В архитектуре сети StyleGAN2 есть специальные трансформации (модуляции), с помощью которых входной случайный вектор контролирует семантические признаки выходного изображения, такие как пол, возраст и так далее. Ученые предложили обучать дополнительный вектор, который определяет домен выходных изображений через аналогичные модуляции.

«Если дополнительно обучать только такой доменный вектор, то домен генерируемых картинок меняется так же хорошо, как если бы мы дообучали все параметры нейронной сети. Это кардинально снижает число оптимизируемых параметров, так как размерность такого доменного вектора всего 6000, что на порядки меньше, чем 30 млн весов нашего генератора», — рассказал Айбек Аланов, первый автор статьи, стажер-исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ и научный сотрудник AIRI.

На основании полученных результатов ученые предложили первый метод мультидоменной адаптации, который позволяет адаптировать модель на несколько доменов сразу. Такая значительная оптимизация дообучения на новые домены сокращает время обучения и используемую память. С помощью такого метода можно обучить гиперсеть, которая имеет меньше параметров, чем исходный генератор, но хранит в себе сотни и даже тысячи новых доменов.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# генератор

# изображение

# нейросеть

# обучение

# портрет

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Библиотека им. М. Ю. Лермонтова

Санкт-Петербург

Лекция

20 Авг

Бесплатно

Русское зарубежье и советские граждане в Движении Сопротивления

Библиотека иностранной литературы

Москва

Лекция

20 Авг

700 ₽

Неожиданная биология: ключевые открытия июля

Центр «Архэ»

Онлайн

Лекция

20 Авг

Бесплатно

Пять принципов здоровья

ВДНХ

Москва

Лекция

20 Авг

Бесплатно

О хвостиках, ушках и лапках. Собаки в космосе

Космонавтика и авиация

Москва

Лекция

21 Авг

Бесплатно

Зоопарки Юго-Восточной Азии: оазисы биоразнообразия

Московский зоопарк

Москва

Космонавтика и авиация

Москва

Лекция

21 Авг

Бесплатно

Эволюция технологий искусственного интеллекта: от генеративных моделей к интерактивным системам

Курилка Гутенберга

Москва

Экскурсия

22 Авг

800 ₽

Сохранить для потомков: здание Политехнического музея в годы войны

Политехнический музей

Москва

Популярное

За сутки

За неделю

За месяц

19 августа, 12:09

Елена Авдеева

Колония микробов помогла получить шоколад высшей пробы

Биотехнологи из Ноттингемского университета (Великобритания) воспроизвели процесс естественной ферментации какао-бобов в лаборатории, чтобы проверить, можно ли улучшить вкус готового продукта «вручную». Оказалось, что правильно подобранная колония микроорганизмов может внести свои нотки и определить качество будущего шоколада.

Химия

# бактерии

# биотехнологии

# какао

# микроорганизмы

# ферментация

19 августа, 11:08

ПНИПУ

Ученый рассказал, почему новую экзопланету в системе Альфа Центавра называют призраком

В системе Альфа Центавра, расположенной всего в 4,5 световых годах от Земли, обнаружена новая экзопланета. Хотя ее поверхность кажется необитаемой, астрономы не исключают, что на ее возможных спутниках могут идти биологические процессы. Ученый Пермского Политеха рассказал, почему это открытие может перевернуть наше представление о механизмах формирования планет.

ПНИПУ

# Альфа Центавра

# газовый гигант

# жизнь

# призраки

# экзопланеты

19 августа, 12:08

КБГУ

Пластик превратили в экологически чистое топливо

В КБГУ разработали инновационный способ переработки пластиковых отходов в экологичное твердое топливо, используя термическое разложение в закрытой системе с нитратно-щелочными расплавами, которые не только ускоряют процесс, но и нейтрализуют токсичные газы, превращая их в безвредные соли. При этом выделяется значительное количество энергии — эксперименты показали, что при нагреве до 450 градусов образуется пламя высотой до трех метров, что делает эту технологию перспективным решением как для утилизации пластика, так и для получения альтернативного топлива без вредных выбросов.

КБГУ

# отходы

# пластик

# пластиковые отходы

# топливо

# экология

16 августа, 19:09

Адель Романова

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Астрономы подсчитали, что с поверхности летящего по Солнечной системе межзвездного объекта 3I/ATLAS каждую секунду испаряется около 40 килограммов водяного льда. Такую сильную кометную активность он проявил, будучи в три с половиной раза дальше Земли от Солнца. По мнению ученых, это довольно необычно.

Астрономия

# кометы

# космос

# межзвездная комета

# межзвездные объекты

# Солнечная система

18 августа, 11:11

Денис Яковлев

Ученые прочитали мысли с рекордной точностью

За последнее десятилетие ученые создали несколько сложных систем «мозг — компьютер», которые позволяли преобразовывать мозговую активность людей, лишившихся способности говорить из-за различных заболеваний, в речь. Однако до сих пор удавалось расшифровать лишь небольшое количество слов. Теперь в США создали алгоритм, благодаря которому удалось распознать до 54 процентов «речи».

Медицина

# имплантация

# интерфейс мозг-компьютер

# нейробиология

# речь

15 августа, 08:25

Любовь С.

Астрономы объяснили природу «Ока Саурона», которое «смотрит» на Землю

Изображение блазара PKS 1424+240, полученное с помощью радиоинтерферометра VLBA, напомнило астрономам легендарное «Око Саурона» из «Властелина колец» — джет, пронизывающий кольцеобразное магнитное поле объекта, устремлен к нашей планете, а сам блазар может оказаться одним из наиболее ярких источников нейтрино в космосе.

Астрономия

# блазары

# джет

# космические лучи

# нейтрино

# радиоастрономия

# сверхмассивные черные дыры

25 июля, 07:47

Адель Романова

У третьего межзвездного объекта нашли признаки управляемого корабля

Прибывшая из межзвездного пространства предполагаемая комета 3I/ATLAS движется по траектории, максимально удобной для гравитационных маневров управляемого корабля, при этом возможность ее отслеживания с Земли практически минимальна. По мнению некоторых ученых, такое «поведение» объекта наводит на определенные мысли.

Астрономия

# внеземные цивилизации

# космос

# межзвездная комета

# межзвездные зонды

# межзвездные объекты

6 августа, 20:59

Татьяна Пичугина

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Примерно 12 800 лет назад в Северном полушарии началось резкое изменение климата, которое сопровождалось вымиранием мегафауны и угасанием культуры Кловис. Такое могло произойти, например, из-за прорыва пресных вод в Атлантику или мощного вулканического извержения. Несколько лет назад ученые обнаружили места на суше с повышенным содержанием элементов платиновой группы, прослоями угля, микрочастицами расплава. По их мнению, это может быть признаком пребывания Земли в потоке обломков кометы или астероида. В новой работе впервые представлены доказательства кометного события в позднем дриасе из морских осадочных толщ.

Геология

# Атлантический океан

# комета

# морское дно

# платина

# событие позднего дриаса

22 июля, 14:44

ФизТех

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.

ФизТех

# ChatGPT

# нейросети

# ошибки

# слова

# текст

[miniorange_social_login]

В НИУ ВШЭ научили нейросеть учиться на несколько порядков эффективнее

По теме

В НИУ ВШЭ ускорили работу нейросети по распознаванию изображений

Новая система позволит генерировать тексты песен, которые повторяют стиль конкретных артистов

Нейросеть освоила видеоигру по языковому гайду

Популярное

Колония микробов помогла получить шоколад высшей пробы

Ученый рассказал, почему новую экзопланету в системе Альфа Центавра называют призраком

Пластик превратили в экологически чистое топливо

На третьем межзвездном объекте нашли воду, и для кометы он выделяет ее необычно интенсивно

Ученые прочитали мысли с рекордной точностью

Астрономы объяснили природу «Ока Саурона», которое «смотрит» на Землю

У третьего межзвездного объекта нашли признаки управляемого корабля

Ученые добыли новые доказательства столкновения с кометой 12 800 лет назад

Ученые выяснили, как отличить текст, написанный ИИ, от человеческого

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Отец дьявола: Алоиз Гитлер

Туринская плащаница: реликвия или подделка?

Мифы и легенды о «пьющей» России

Есть ли жизнь на Марсе? Будет!

Дальний родственник Наполеона и Эйнштейна: каким на самом деле было происхождение Гитлера?

Добро пожаловать в войд Волопаса — самое страшное место во Вселенной

Взгляд с другой стороны океана. Что вы знаете об участии США и их союзников во Второй мировой войне? Тест

Удивительные факты о животных

В НИУ ВШЭ научили нейросеть учиться на несколько порядков эффективнее

По теме

В НИУ ВШЭ ускорили работу нейросети по распознаванию изображений

Новая система позволит генерировать тексты песен, которые повторяют стиль конкретных артистов

Нейросеть освоила видеоигру по языковому гайду

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?