Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Новые алгоритмы ускоряют машинное обучение в децентрализованных сетях
Международная команда ученых совершила прорыв в области распределенного машинного обучения, разработав новые алгоритмы, значительно повышающие эффективность обучения моделей в федеративных сетях. Исследование, проведенное группой, куда вошли специалисты МФТИ, представляет собой значительный шаг вперед в решении проблемы высокой вычислительной сложности обучения больших моделей в распределенных системах.
Результаты опубликованы в материалах конференции NeurIPS 2024. Современное машинное обучение часто опирается на обучение моделей на огромных объемах данных, что требует распределенных вычислений. Федеративное обучение (Federated Learning, FL) — это подход, позволяющий обучать модели на децентрализованных данных, хранящихся на множестве устройств (смартфоны, медицинские приборы и так далее), без прямого обмена этими данными.
Ключевая проблема федеративного обучения заключается в высокой коммуникационной сложности. А именно передача данных и вычисление градиентов на основе них (векторов, характеризующих направление изменения параметров модели) становится проблемой, которая замедляет весь процесс обучения. Коммуникационная сложность заключается в огромном количестве передач данных по сети, необходимых для достижения заданной точности решения.
Обычно для решения этой проблемы используют стохастический градиентный спуск. Он основан на том, чтобы использовать неполную информацию для вычисления градиента, выбирая используемые данные для этого случайным образом. такие методы делятся на методы с возвращением и без возвращения. При выборе с возвращением один и тот же набор данных может быть выбран несколько раз, а при выборе без возвращения каждый набор данных выбирается только один раз.
В свежей статье, представленной на конференции NeurIPS 2024, авторы предлагают новые подходы. Они разработали четыре новых алгоритма, сочетающие сжатие градиентов с методом случайной перестановки и локальными вычислениями.

Сравнение алгоритмов Q-RR, QSGD, DIANA и DIANA-RR в задаче обучения глубокой нейронной сети / © NeurIPS 2024
Первый новый алгоритм они назвали Q-RR (Quantized Random Reshuffling). Это самый наивный подход, сочетающий сжатие градиентов и метод перестановки. К сожалению, теоретический анализ показал, что этот метод не демонстрирует преимуществ перед традиционными методами сжатия градиентов.
Второй предложенный учеными метод, названный ими DIANA-RR, является модификацией первого. Они улучшили предыдущий подход, добавив снижение дополнительной дисперсии, которая возникла из-за сжатия градиентов. В результате им удалось получить алгоритм, который имеет лучшую скорость сходимости, чем существующие аналоги, основанные на выборке с возвращением.
Для лучшей адаптации к задачам федеративного обучения ученые расширили алгоритмы Q-RR и DIANA-RR, добавив локальные вычислительные шаги. Так они получили ещё два новых метода, которые назвали Q-NASTYA и DIANA-NASTYA. Эти методы используют разные размеры шагов для локальных и глобальных обновлений. Однако при этом и DIANA-NASTYA, и DIANA-RR предназначены для уменьшения дополнительной дисперсии, вносимой сжатием градиентов.
Авторы исследования провели теоретический анализ и три численных эксперимента, которые подтвердили эффективность предложенных алгоритмов. Алгоритмы DIANA-RR и DIANA-NASTYA значительно превосходят по скорости сходимости существующие методы, особенно при высокой степени сжатия градиентов и в условиях, когда требуется высокая точность.
Для моделирования в первых двух экспериментах авторы использовали решение бинарной проблемы классификации (проверке принадлежности объектов к одному из двух классов) методом логистической регрессии с регуляризацией. В первых двух экспериментах они сравнивали между собой локальные и нелокальные методы.
Оказалось, что результаты, наблюдаемые в численных экспериментах, идеально соответствовали выведенной теории.
В третьем эксперименте авторы использовали нелокальные методы для распределенного машинного обучения глубокой нейронной сети, и в нем новые методы тоже показали свое преимущество над традиционными подходами.
«Многие существующие работы в области федеративного обучения рассматривают методы стохастического градиентного спуска с возвращением. Однако недавно удалось показать как теоретически, так и практически, что методы, основанные на выборке без возвращения, например, метод случайной перестановки, работают лучше», — рассказал Абдурахмон Садиев, научный сотрудник лаборатории численных методов прикладной структурной оптимизации ФПМИ МФТИ.
Разработанные алгоритмы представляют собой важный вклад в область федеративного обучения, позволяя существенно ускорить процесс обучения больших моделей при ограниченных коммуникационных ресурсах. Это открывает новые возможности для применения машинного обучения в различных областях, где важна защита конфиденциальности данных. Дальнейшие исследования будут направлены на оптимизацию алгоритмов и их адаптацию к более сложным задачам федеративного обучения.
Археологи обнаружили на стенах гробниц египетской знати в Долине царей надписи на древних индийских языках. Эти граффити оставили путешественники из Южной Азии, посещавшие Египет в начале первого тысячелетия нашей эры, когда он был провинцией Римской империи. Находки подтвердили, что Долина царей уже в те времена была популярным туристическим аттракционом.
Антиген стволовых клеток простаты (PSCA) — это белок, который участвует в патогенезе заболеваний предстательной железы. Его вторая роль касается развития болезни Альцгеймера и других неврологических патологий. Новая статья ученых из МФТИ и ИБХ РАН с соавторами описала структуру PSCA, его фармакологические свойства и участие в нейровоспалении, что поможет создать новые лекарства.
Белки из почвенного мицелия связали частицы воды и запустили кристаллизацию при слабом минусе. Эти молекулы работали в виде водного раствора без привязки к липидным оболочкам живых клеток. Грибы получили такую способность от бактерий сотни тысяч лет назад через параллельный перенос генов.
Археологи обнаружили на стенах гробниц египетской знати в Долине царей надписи на древних индийских языках. Эти граффити оставили путешественники из Южной Азии, посещавшие Египет в начале первого тысячелетия нашей эры, когда он был провинцией Римской империи. Находки подтвердили, что Долина царей уже в те времена была популярным туристическим аттракционом.
Антиген стволовых клеток простаты (PSCA) — это белок, который участвует в патогенезе заболеваний предстательной железы. Его вторая роль касается развития болезни Альцгеймера и других неврологических патологий. Новая статья ученых из МФТИ и ИБХ РАН с соавторами описала структуру PSCA, его фармакологические свойства и участие в нейровоспалении, что поможет создать новые лекарства.
Каждую весну оплодотворенные матки шмелей выходят из зимовки и основывают новые колонии. Но как они умудряются выжить, если во время «спячки» их подземное убежище часто подтапливают талые или дождевые воды? Первыми на этот вопрос в 2024 году ответила команда канадских биологов. Они выяснили, что шмели способны безопасно проводить под водой до недели. Теперь другая группа ученых решила выяснить, какой именно физиологический механизм стоит за этим феноменом.
В ноябре 2025 года при взлете российской ракеты с Байконура к МКС с существенной высоты упала кабина обслуживания 8У216. Поскольку в 2010-х годах из экономии средств у нас отказались от дублирования стартовых площадок, это создало ситуацию временной невозможности пилотируемых полетов. Теперь, всего через три месяца после происшествия, «Роскосмос» смог решить проблему, поставив запасную кабину обслуживания, найденную на складах Минобороны. Весенние пуски к МКС, запланированные ранее, теперь имеют шансы пройти в срок.
Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.
В той части Пиренеев, которые находятся на территории Испании, исследователи обнаружили первые доказательства добычи золота в эпоху Римской империи. На месте древних рудников нашли сложные гидравлические сооружения и остатки водохранилища, возраст которых определили с помощью метода оптического датирования. Открытие прольет свет на инженерные приемы римлян и поставит точку в многолетнем споре: действительно ли римляне добывали золото в этом регионе.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
