15.02.2024, 11:00

НИУ ВШЭ

В НИУ ВШЭ улучшили модель диффузионной нейросети

❋ 4.4

Ученые Центра искусственного интеллекта и факультета компьютерных наук НИУ ВШЭ, а также Института искусственного интеллекта AIRI и Sber AI разработали новую структуру диффузионной модели, для которой возможно задать восемь видов распределения шума. Вместо классической структуры модели в виде цепи Маркова и применения нормального распределения ученые предложили звездообразную модель, где возможно выбирать тип распределения. Это поможет решать задачи в разных геометрических пространствах с помощью диффузионных моделей.

НИУ ВШЭ

# диффузия

# модель

# нейросети

# нейросеть

Российские ученые улучшили модель диффузионной нейросети / © Getty images

Результаты работы были представлены на конференции NeurIPS 2023. За последние 20 лет генеративные нейросети стали работать лучше. Если раньше они создавали не очень качественные тексты и изображения за один шаг, то с появлением диффузионных моделей — разновидности генеративных нейросетей — процесс стал постепенным, и результат улучшился.

Диффузионные нейросети основаны на вероятностной модели шумоподавления и диффузии, или DDPM. Модель работает так: на каждом этапе к данным добавляются случайные изменения. Например, с каждым шагом могут изменяться цвета или яркость. Эти изменения постепенно уменьшают шум и делают данные более похожими на нужный результат до тех пор, пока из хаоса не получится конечное изображение.

В основе модели лежит цепь Маркова, которая постепенно добавляет шум, а затем так же постепенно обращает процесс диффузии вспять, чтобы получить исходные данные, например картинку с котиком. Нейросеть учится этим преобразованиям на тренировочных данных, в которых есть пример оригинального изображения и его зашумленных версий.

Такие модели хорошо генерируют картинки, звуки, но с более сложными задачами, например генерированием объемных структур, справляются хуже. Это происходит из-за того, что шаги зашумления диффузионной модели работают только с помощью нормального распределения. И если исходные объекты имеют ограничения, их невозможно задать и сохранить на протяжении всех шагов.

Иллюстрация процесса диффузии / © cvpr2022-tutorial-diffusion-models.github.io

Команда исследователей предложила новый тип модели, который упрощает процесс работы с данными. В новой структуре диффузионной модели стало возможным изменять тип распределения шума. Чтобы этого добиться, исследователи преобразовали структуру модели в звездообразную, где все состояния были не внутри марковской цепочки, а расходились из исходного объекта в стороны.

«Например, задача нейросети — сгенерировать молекулу. В составе молекулы есть три типа атомов, которые задаются с помощью дискретных данных. Если зашумить эти данные нормальным распределением, то типы атомов станут принимать не существующие в реальном мире значения. В звездообразной модели мы можем подобрать нужный тип распределения, при котором данные не будут искажаться», — комментирует один из авторов статьи, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ Андрей Охотин.

Сравнение оригинального изображения, результата работы классической диффузионной модели и звездообразной диффузионной модели при генерации двухмерного симплекса / © Пресс-служба НИУ ВШЭ

В структуре модели две компоненты. Первая отвечает за зашумление объекта путем пошагового удаления информации, а вторая учится делать шаг назад в этой цепочке. Модель возможно задать для восьми видов распределений, которые поддерживают ограничения данных.

«Мы перешли к новой структуре обратного процесса. Если раньше каждое следующее состояние можно было получить, используя только одно предыдущее, то теперь каждое состояние объекта зависит от всех предыдущих, — объясняет научный руководитель Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ, научный консультант AIRI Дмитрий Ветров. — При такой структуре информация собирается в один объект, который мы назвали хвостовой статистикой, и подается в нейронную сеть, чтобы она сделала следующий шаг. Это позволяет эффективнее обучать модель».

Ученые сравнили эффективность звездообразной модели с классическими диффузионными моделями. На задачах генерации текста в обычном режиме модель ученых работала на таком же уровне качества. А в ускоренном режиме (при меньшем числе шагов генерации) модель для изображений работала лучше и генерировала набор данных ближе к исходному.

Сравнение оригинального изображения и результата звездообразной диффузионной модели / © Пресс-служба НИУ ВШЭ

Со сложными задачами, связанными с генерацией точек в разных геометрических пространствах — сфере, симплексе и пространстве матриц, описывающих эллипсы, — звездообразная модель справлялась лучше, чем классическая диффузионная модель.

В задаче с генерацией точек на сфере модели нужно было научиться отмечать точки в тех местах, где, согласно геодезическому набору данных 2020 года, на поверхности Земли чаще всего происходили пожары. После этого сравнивались точки, которые были в действительности, и те, что сгенерировала модель. Модель сгенерировала точки максимально приближенно к оригиналу. Полученные результаты сопоставимы с существующими методами решения этой задачи.

«В этой статье мы предложили более универсальную диффузионную модель, которая позволяет генерировать объекты сложной структуры. Это поможет применять такие методы для более широкого класса задач из естественных наук, например из биологии, физики, химии, где есть структурные ограничения при генерации объектов: молекул, состояний элементарных частиц, химических соединений», — комментирует один из авторов статьи, младший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ, научный сотрудник AIRI Айбек Аланов.

Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве России.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».

НИУ ВШЭ

# диффузия

# модель

# нейросети

# нейросеть

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

От тучерезов до небоскребов

Политехнический музей

Москва

Лекция

08 Июл

Бесплатно

Многоканальная астрономия

Москва

Возвращение мамонта: клонирование, генное чудо или фейк?

Центр «Архэ»

Онлайн

Лекция

09 Июл

Бесплатно

Эра персонализированной медицины или зачем каждому из нас нужен генетический тест?

Москва

Мамонты: от гигантов до карликов – вымирание, смертельные инфекции и греческие мифы

Московский зоопарк

Москва

Лекция

09 Июл

Бесплатно

Миф об Аркадии и образ Канады как «французского рая»

Библиотека иностранной литературы

Москва

Лекция

09 Июл

Бесплатно

State of AI: как ускоряется прогресс и куда все это катится

Библиотека Планетарий 1

Санкт-Петербург

Лекция

09 Июл

Бесплатно

Онтология в реальных задачах людей и ИИ-агентов

Европейский университет

Онлайн

Лекция

09 Июл

1000 ₽

Насекомые — пришельцы нашей Земли

Medio Modo

Москва

Популярное

За сутки

За неделю

За месяц

7 июля, 08:30

ПНИПУ

Скорость восстановления иммунитета после коронавируса связали с полом пациента

Инфекции, такие как коронавирус, наносят серьезный удар организму, из-за чего даже после выздоровления он продолжительное время остается уязвимым. Сегодня для оценки иммунитета врачи смотрят в первую очередь на уровень антител в крови, однако такой подход не отражает реального состояния здоровья человека. Это не позволяет врачам точно прогнозировать, как будет протекать болезнь и насколько быстро пациент выздоровеет. Ученые Пермского Политеха и ПГАТУ впервые выяснили, как именно восстановление иммунитета зависит от пола человека и кто наиболее подвержен осложнениям после коронавирусной инфекции. Результаты исследования помогут правильно учитывать гендерные особенности пациента при лечении и реабилитации, что повысит точность прогнозов и эффективность терапии.

ПНИПУ

# COVID-19

# иммунитет

# коронавирус

# мужчины и женщины

8 июля, 13:25

Александр Березин

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

Плавящийся асфальт в США, многие тысячи погибших в Западной Европе, своеобразное лето в России — все это списывают на вредоносный феномен рекордного Эль-Ниньо. И конечно же, на него спихивают и ожидаемый рост цен на кофе и основные сельхозтовары. Правда, есть в этой картине и белые пятна: в прошлые Эль-Ниньо мировые урожаи росли. Что скорее всего случится в 2026 году и отчего роль этого события может быть куда больше, чем мы думаем?

Климат

# глобальное потепление

# климат

# климатология

# торнадо

# ураганы

# Эль-Ниньо

Выбор редакции

6 июля, 11:29

РНФ

В России научились управлять яркостью свечения молекулярных комплексов

Ученые синтезировали три новых комплекса металла европия и нашли способ управлять яркостью их свечения (люминесценции). Подобные светящиеся соединения востребованы в биологии и медицине для визуализации тканей и отслеживания распределения лекарств по организму, а также в технике при разработке энергоэффективных дисплеев и светодиодов.

РНФ

# лиганды

# люминисценция

# материалы

# химия

4 июля, 09:30

Любовь С.

Древнейшие звезды Млечного Пути помогли уточнить возраст Вселенной

Анализ более 150 тысяч древних звезд Млечного Пути показал, что возраст космоса, судя по всему, близок к 13,8 миллиарда лет. Авторы нового исследования заключили, что сценарии, в которых Вселенную приходится делать заметно «моложе» ради решения хаббловского кризиса, плохо согласуются с наблюдениями. Это важно, поскольку возраст старейших светил — один из немногих независимых способов проверить космологические модели не по данным ранней Вселенной, а по объектам нашей собственной Галактики.

Астрономия

# вселенная

# звезды

# постоянная Хаббла

# спектроскопия

# стандартная космологическая модель

6 июля, 14:44

Илья Гриднев

Физики впервые отследили электрон на квантово-механическом пространственно-временном пределе

Сканирующая туннельная микроскопия достигла квантово-механического предела пространства-времени. Физики провели эксперимент и смоделировали перемещение одиночного электрона с атомарной точностью и скоростью в доли фемтосекунды. Результат показал границы применимости квантовых законов и объяснил механику сверхбыстрых процессов.

Физика

# аттосекунды

# квантовая механика

# квантовое туннелирование

# микроскопия

# электроны

7 июля, 08:30

ПНИПУ

Скорость восстановления иммунитета после коронавируса связали с полом пациента

ПНИПУ

# COVID-19

# иммунитет

# коронавирус

# мужчины и женщины

10 июня, 11:51

Александр Березин

Американские ученые заявили о первом в истории создании GPS-помех из космоса — русскими спутниками

Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.

Оружие и техника

# GPS

# космонавтика

# космос

# спутники

25 июня, 16:20

Любовь С.

Физики уточнили возможные размеры Вселенной

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

Астрономия

# бесконечность

# вселенная

# геометрия

# пространство

# реликтовое излучение

# свет

# топология

25 июня, 15:09

Марк Чернов

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

Физика

# вода

# Молекулярная биология

# структура воды

# фазовые переходы

[miniorange_social_login]

В НИУ ВШЭ улучшили модель диффузионной нейросети

По теме

Представлена модель ИИ, которая распознает объекты, отраженные в зеркале

Искусственный интеллект помог «навести порядок» в наблюдениях за Солнцем

В МТУСИ разработали нейросетевую модель распознавания голосовых команд для системы управления роботом-манипулятором

Популярное

Скорость восстановления иммунитета после коронавируса связали с полом пациента

Климатический «щелчок»: может ли Эль-Ниньо изменить привычный нам мир

В России научились управлять яркостью свечения молекулярных комплексов

Древнейшие звезды Млечного Пути помогли уточнить возраст Вселенной

Физики впервые отследили электрон на квантово-механическом пространственно-временном пределе

Скорость восстановления иммунитета после коронавируса связали с полом пациента

Американские ученые заявили о первом в истории создании GPS-помех из космоса — русскими спутниками

Физики уточнили возможные размеры Вселенной

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Лайк и репост: вместо тысячи слов

Наш собственный космос: что мы узнали об океане за последние 10 лет

С точки зрения науки: помогают ли маски от вируса?

Топ ошибок человечества

Дозор окончен: почему NASA отключает орбитальный телескоп, выслеживающий опасные астероиды

Лазерное оружие сегодня и завтра

Самые странные объекты на картах Google Earth

Как роботы будут работать вместе с людьми. Интервью с Романом Мещеряковым

В НИУ ВШЭ улучшили модель диффузионной нейросети

По теме

Представлена модель ИИ, которая распознает объекты, отраженные в зеркале

Искусственный интеллект помог «навести порядок» в наблюдениях за Солнцем

В МТУСИ разработали нейросетевую модель распознавания голосовых команд для системы управления роботом-манипулятором

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?