Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В НИУ ВШЭ улучшили модель диффузионной нейросети
Ученые Центра искусственного интеллекта и факультета компьютерных наук НИУ ВШЭ, а также Института искусственного интеллекта AIRI и Sber AI разработали новую структуру диффузионной модели, для которой возможно задать восемь видов распределения шума. Вместо классической структуры модели в виде цепи Маркова и применения нормального распределения ученые предложили звездообразную модель, где возможно выбирать тип распределения. Это поможет решать задачи в разных геометрических пространствах с помощью диффузионных моделей.
Результаты работы были представлены на конференции NeurIPS 2023. За последние 20 лет генеративные нейросети стали работать лучше. Если раньше они создавали не очень качественные тексты и изображения за один шаг, то с появлением диффузионных моделей — разновидности генеративных нейросетей — процесс стал постепенным, и результат улучшился.
Диффузионные нейросети основаны на вероятностной модели шумоподавления и диффузии, или DDPM. Модель работает так: на каждом этапе к данным добавляются случайные изменения. Например, с каждым шагом могут изменяться цвета или яркость. Эти изменения постепенно уменьшают шум и делают данные более похожими на нужный результат до тех пор, пока из хаоса не получится конечное изображение.
В основе модели лежит цепь Маркова, которая постепенно добавляет шум, а затем так же постепенно обращает процесс диффузии вспять, чтобы получить исходные данные, например картинку с котиком. Нейросеть учится этим преобразованиям на тренировочных данных, в которых есть пример оригинального изображения и его зашумленных версий.
Такие модели хорошо генерируют картинки, звуки, но с более сложными задачами, например генерированием объемных структур, справляются хуже. Это происходит из-за того, что шаги зашумления диффузионной модели работают только с помощью нормального распределения. И если исходные объекты имеют ограничения, их невозможно задать и сохранить на протяжении всех шагов.

Команда исследователей предложила новый тип модели, который упрощает процесс работы с данными. В новой структуре диффузионной модели стало возможным изменять тип распределения шума. Чтобы этого добиться, исследователи преобразовали структуру модели в звездообразную, где все состояния были не внутри марковской цепочки, а расходились из исходного объекта в стороны.
«Например, задача нейросети — сгенерировать молекулу. В составе молекулы есть три типа атомов, которые задаются с помощью дискретных данных. Если зашумить эти данные нормальным распределением, то типы атомов станут принимать не существующие в реальном мире значения. В звездообразной модели мы можем подобрать нужный тип распределения, при котором данные не будут искажаться», — комментирует один из авторов статьи, стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ Андрей Охотин.

В структуре модели две компоненты. Первая отвечает за зашумление объекта путем пошагового удаления информации, а вторая учится делать шаг назад в этой цепочке. Модель возможно задать для восьми видов распределений, которые поддерживают ограничения данных.
«Мы перешли к новой структуре обратного процесса. Если раньше каждое следующее состояние можно было получить, используя только одно предыдущее, то теперь каждое состояние объекта зависит от всех предыдущих, — объясняет научный руководитель Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ, научный консультант AIRI Дмитрий Ветров. — При такой структуре информация собирается в один объект, который мы назвали хвостовой статистикой, и подается в нейронную сеть, чтобы она сделала следующий шаг. Это позволяет эффективнее обучать модель».
Ученые сравнили эффективность звездообразной модели с классическими диффузионными моделями. На задачах генерации текста в обычном режиме модель ученых работала на таком же уровне качества. А в ускоренном режиме (при меньшем числе шагов генерации) модель для изображений работала лучше и генерировала набор данных ближе к исходному.

Со сложными задачами, связанными с генерацией точек в разных геометрических пространствах — сфере, симплексе и пространстве матриц, описывающих эллипсы, — звездообразная модель справлялась лучше, чем классическая диффузионная модель.
В задаче с генерацией точек на сфере модели нужно было научиться отмечать точки в тех местах, где, согласно геодезическому набору данных 2020 года, на поверхности Земли чаще всего происходили пожары. После этого сравнивались точки, которые были в действительности, и те, что сгенерировала модель. Модель сгенерировала точки максимально приближенно к оригиналу. Полученные результаты сопоставимы с существующими методами решения этой задачи.
«В этой статье мы предложили более универсальную диффузионную модель, которая позволяет генерировать объекты сложной структуры. Это поможет применять такие методы для более широкого класса задач из естественных наук, например из биологии, физики, химии, где есть структурные ограничения при генерации объектов: молекул, состояний элементарных частиц, химических соединений», — комментирует один из авторов статьи, младший научный сотрудник Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ, научный сотрудник AIRI Айбек Аланов.
Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве России.
Хотя лед кажется простым веществом, причина, по которой он настолько скользкий, до сих пор оставалась предметом споров. Недавно физики показали, что при движении по льду трение слегка нагревает его поверхность. Это приводит к образованию тончайшей пленки воды, которая действует как смазка. Некоторые детали этого механизма ученым еще предстоит уточнить.
Исследователи впервые испытали на человеке новую технологию медицинской визуализации — магнитно-частичную томографию (MPI). С ее помощью они смогли в реальном времени наблюдать движение крови по венам руки. Метод работает без рентгеновского излучения и может стать более безопасной альтернативой традиционной сосудистой ангиографии.
В условиях повышения уровня Мирового океана под угрозой находятся прибрежные экосистемы и их обитатели. Ученые из Нидерландов выявили необычный механизм, позволяющий защищать песчаные берега от разрушения.
Хотя лед кажется простым веществом, причина, по которой он настолько скользкий, до сих пор оставалась предметом споров. Недавно физики показали, что при движении по льду трение слегка нагревает его поверхность. Это приводит к образованию тончайшей пленки воды, которая действует как смазка. Некоторые детали этого механизма ученым еще предстоит уточнить.
Отдельные аспекты полового поведения живых организмов порой могут оказывать огромное влияние на пищевые цепочки и целые экосистемы. Ученые на примере североамериканских рыб доказали, что агрессивное половое поведение их самцов может помочь в выживании зоопланктона.
Археологи обнаружили на стенах гробниц египетской знати в Долине царей надписи на древних индийских языках. Эти граффити оставили путешественники из Южной Азии, посещавшие Египет в начале первого тысячелетия нашей эры, когда он был провинцией Римской империи. Находки подтвердили, что Долина царей уже в те времена была популярным туристическим аттракционом.
В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.
Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.
В той части Пиренеев, которые находятся на территории Испании, исследователи обнаружили первые доказательства добычи золота в эпоху Римской империи. На месте древних рудников нашли сложные гидравлические сооружения и остатки водохранилища, возраст которых определили с помощью метода оптического датирования. Открытие прольет свет на инженерные приемы римлян и поставит точку в многолетнем споре: действительно ли римляне добывали золото в этом регионе.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
