20.12.2024, 14:52

ФизТех

Новые алгоритмы ускоряют машинное обучение в децентрализованных сетях

❋ 4.4

Международная команда ученых совершила прорыв в области распределенного машинного обучения, разработав новые алгоритмы, значительно повышающие эффективность обучения моделей в федеративных сетях. Исследование, проведенное группой, куда вошли специалисты МФТИ, представляет собой значительный шаг вперед в решении проблемы высокой вычислительной сложности обучения больших моделей в распределенных системах.

ФизТех

# алгоритмы

# вычисления

# децентрализованные сети

# машинное обучение

Сравнение новых четырех предложенных методов (Q-NASTYA, DIANA-NASTYA, Q-RR, DIANA-RR) и существующих (FedCOM, FedPAQ) с настроенными размерами шагов и компрессором Rand-k. / © NeurIPS 2024

Результаты опубликованы в материалах конференции NeurIPS 2024. Современное машинное обучение часто опирается на обучение моделей на огромных объемах данных, что требует распределенных вычислений. Федеративное обучение (Federated Learning, FL) — это подход, позволяющий обучать модели на децентрализованных данных, хранящихся на множестве устройств (смартфоны, медицинские приборы и так далее), без прямого обмена этими данными.

Ключевая проблема федеративного обучения заключается в высокой коммуникационной сложности. А именно передача данных и вычисление градиентов на основе них (векторов, характеризующих направление изменения параметров модели) становится проблемой, которая замедляет весь процесс обучения. Коммуникационная сложность заключается в огромном количестве передач данных по сети, необходимых для достижения заданной точности решения.

Обычно для решения этой проблемы используют стохастический градиентный спуск. Он основан на том, чтобы использовать неполную информацию для вычисления градиента, выбирая используемые данные для этого случайным образом. такие методы делятся на методы с возвращением и без возвращения. При выборе с возвращением один и тот же набор данных может быть выбран несколько раз, а при выборе без возвращения каждый набор данных выбирается только один раз.

В свежей статье, представленной на конференции NeurIPS 2024, авторы предлагают новые подходы. Они разработали четыре новых алгоритма, сочетающие сжатие градиентов с методом случайной перестановки и локальными вычислениями.

Сравнение алгоритмов Q-RR, QSGD, DIANA и DIANA-RR в задаче обучения глубокой нейронной сети / © NeurIPS 2024

Первый новый алгоритм они назвали Q-RR (Quantized Random Reshuffling). Это самый наивный подход, сочетающий сжатие градиентов и метод перестановки. К сожалению, теоретический анализ показал, что этот метод не демонстрирует преимуществ перед традиционными методами сжатия градиентов.

Второй предложенный учеными метод, названный ими DIANA-RR, является модификацией первого. Они улучшили предыдущий подход, добавив снижение дополнительной дисперсии, которая возникла из-за сжатия градиентов. В результате им удалось получить алгоритм, который имеет лучшую скорость сходимости, чем существующие аналоги, основанные на выборке с возвращением.

Для лучшей адаптации к задачам федеративного обучения ученые расширили алгоритмы Q-RR и DIANA-RR, добавив локальные вычислительные шаги. Так они получили ещё два новых метода, которые назвали Q-NASTYA и DIANA-NASTYA. Эти методы используют разные размеры шагов для локальных и глобальных обновлений. Однако при этом и DIANA-NASTYA, и DIANA-RR предназначены для уменьшения дополнительной дисперсии, вносимой сжатием градиентов.

Авторы исследования провели теоретический анализ и три численных эксперимента, которые подтвердили эффективность предложенных алгоритмов. Алгоритмы DIANA-RR и DIANA-NASTYA значительно превосходят по скорости сходимости существующие методы, особенно при высокой степени сжатия градиентов и в условиях, когда требуется высокая точность.

Для моделирования в первых двух экспериментах авторы использовали решение бинарной проблемы классификации (проверке принадлежности объектов к одному из двух классов) методом логистической регрессии с регуляризацией. В первых двух экспериментах они сравнивали между собой локальные и нелокальные методы.

Оказалось, что результаты, наблюдаемые в численных экспериментах, идеально соответствовали выведенной теории.

В третьем эксперименте авторы использовали нелокальные методы для распределенного машинного обучения глубокой нейронной сети, и в нем новые методы тоже показали свое преимущество над традиционными подходами.

«Многие существующие работы в области федеративного обучения рассматривают методы стохастического градиентного спуска с возвращением. Однако недавно удалось показать как теоретически, так и практически, что методы, основанные на выборке без возвращения, например, метод случайной перестановки, работают лучше», — рассказал Абдурахмон Садиев, научный сотрудник лаборатории численных методов прикладной структурной оптимизации ФПМИ МФТИ.

Разработанные алгоритмы представляют собой важный вклад в область федеративного обучения, позволяя существенно ускорить процесс обучения больших моделей при ограниченных коммуникационных ресурсах. Это открывает новые возможности для применения машинного обучения в различных областях, где важна защита конфиденциальности данных. Дальнейшие исследования будут направлены на оптимизацию алгоритмов и их адаптацию к более сложным задачам федеративного обучения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.

ФизТех

# алгоритмы

# вычисления

# децентрализованные сети

# машинное обучение

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Эволюция социальности позвоночных в контексте происхождения человеческого общества

Библиотека им. Н. А. Некрасова

Москва

Лекция

14 Июл

Бесплатно

Устойчивость транспортной системы, или нужны ли нам электросамокаты?

Библиотека Планетарий 1

Санкт-Петербург

Лекция

15 Июл

2000 ₽

Будущее русского языка

Medio Modo

Москва

Лекция

15 Июл

Бесплатно

Почему «Война и мир» – великая книга?

ВДНХ

Москва

Лекция

15 Июл

Бесплатно

Философия искусственного интеллекта: новые вопросы о человеке и мире

Библиотека им. Анны Ахматовой

Москва

Лекция

16 Июл

Бесплатно

Миклухо-Маклай и секретное плавание корвета «Скобелев»

Русское географическое общество

Санкт-Петербург

Лекция

16 Июл

Бесплатно

Вирусы против опухоли: новые подходы в терапии рака

Парк «Зарядье»

Москва

Лекция

16 Июл

Бесплатно

Сердце как инженерная задача: от насоса к тканевой инженерии

Центр «Архэ»

Москва

Лекция

16 Июл

Бесплатно

Пластик: враг планеты или лучший материал цивилизации?

ИЦАЭ

Санкт-Петербург

Популярное

За сутки

За неделю

За месяц

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Кит живет двести лет, умеет пробивать головой полуметровый лед и поет океанский джаз голосом несмазанной дверной петли. Охотоморские гренландские киты — это не просто многотонные ледоколы. Это древние узники, которые остались жить в Охотском море со времен последнего оледенения. Это счастливцы, которые смогли пережить гарпуны китобоев XIX-XX веков, но сегодня уязвимы не меньше. Чтобы спасти этих поразительных китов, российским ученым и команде фонда «Природа и люди» приходится: считать хвосты, читать биографии по шрамам, прятать подростков от хищников, стрелять (спутниковыми метками) с парамоторов и тяжелых дронов. Рассказываем, как устроена жизнь гренландских китов России и кто помогает им не исчезнуть навсегда с лица планеты.

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

13 июля, 20:02

Evgenia Vavilova

Физик создал маленькую Вселенную, для которой нет понятия времени

Деревья растут и люди стареют не потому, что идет время, а из-за происходящих внутри них процессов. Но можно ли сказать, что именно эти процессы порождают время? Ученый создал маленькую Вселенную, в которой дела обстоят именно так.

Физика

# время

# коденсат Бозе-Эйнштейна

# лазеры

# Общая теория относительности

# рубидий

# энтропия

14 июля, 10:10

Марк Чернов

Физики впервые объяснили, почему золото не тускнеет тысячелетиями

Ученые выяснили, что золото владеет уникальной «техникой самообороны», которая защищает его от потускнения. Оказалось, атомы на поверхности этого металла способны самостоятельно перестраиваться в особые защитные структуры. Такой невидимый барьер блокирует контакт с кислородом и подавляет процесс окисления в триллион раз эффективнее, чем поверхность любого другого металла.

Химия

# Золото

# материаловедение

# наноматериалы

# окисление

# химия

13 июля, 14:06

Максим Абдулаев

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Биология

# Баренцево море

# горбатые киты

# защита природы

# китообразные

# киты

# косатки

# природа

# усатые киты

Выбор редакции

12 июля, 12:24

Марк Чернов

Интервальное голодание оказалось не хуже подсчета калорий — и оно значительно легче переносится

Ученые выяснили, почему интервальное голодание для многих оказывается эффективнее обычных диет. Исследование показало, что ограничение времени для приема пищи избавляет худеющего от изнуряющего ощущения жесткого контроля и при этом позволяет сбросить ровно столько же, сколько при скрупулезном подсчете калорий.

Медицина

# диета

# интервальное голодание

# лишний вес

# метаболизм

# питание

# похудение

13 июля, 20:02

Evgenia Vavilova

Физик создал маленькую Вселенную, для которой нет понятия времени

Физика

# время

# коденсат Бозе-Эйнштейна

# лазеры

# Общая теория относительности

# рубидий

# энтропия

25 июня, 16:20

Любовь С.

Физики уточнили возможные размеры Вселенной

Вселенная может оказаться «замкнутой» глобальной структурой, где свет от далеких галактик способен возвращаться к наблюдателю с разных направлений. Именно такой сценарий не удалось исключить авторам нового масштабного обзора. Проверить его предсказания астрономы смогут уже в ближайшие годы.

Астрономия

# бесконечность

# вселенная

# геометрия

# пространство

# реликтовое излучение

# свет

# топология

25 июня, 15:09

Марк Чернов

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Ученые впервые на молекулярном уровне доказали, что обычная вода одновременно состоит из двух разных жидких состояний — более плотного и менее плотного, которые непрерывно сменяют друг друга. Раз молекулярная «двойственность» действительно существует, это подтверждает спорную 30-летнюю гипотезу. Новое открытие поможет, наконец, объяснить десятки «странных» физических аномалий воды, включая ее расширение при замерзании и парадоксальное изменение вязкости под давлением.

Физика

# вода

# Молекулярная биология

# структура воды

# фазовые переходы

26 июня, 14:54

Максим Абдулаев

Начало деменции у пожилых собак определили по их походке

Американские ветеринары установили, что длина шага передних лап у пожилых собак отражает возрастные изменения в работе мозга. Когда у собак развивается деменция, шаги их передних лап становятся короче, причем эта связь не зависит от хронической боли в суставах.

Биология

# деменция

# походка

# собаки

# старение

[miniorange_social_login]

Новые алгоритмы ускоряют машинное обучение в децентрализованных сетях

По теме

Простой метод оценки неопределенности в машинном обучении оказался точным и менее затратным

Алгоритмы машинного обучения помогут точнее оценивать будущее российских компаний

Разработан эффективный «оптимистичный» алгоритм для обучения с подкреплением

Популярное

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Физик создал маленькую Вселенную, для которой нет понятия времени

Физики впервые объяснили, почему золото не тускнеет тысячелетиями

Пережившие китобоев: как в России спасают гренландских китов Охотского моря и не только

Интервальное голодание оказалось не хуже подсчета калорий — и оно значительно легче переносится

Физик создал маленькую Вселенную, для которой нет понятия времени

Физики уточнили возможные размеры Вселенной

Физики подтвердили гипотезу о существовании двух жидких состояний воды

Начало деменции у пожилых собак определили по их походке

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Что такое микрочастицы и угрожают ли они человеку? А микропластик?

Введение в Теорию всего: просто – о главной цели современной физики

Лики созависимости

Февраль 1917 года: как одна теория заговора определила реальность наших дней

10 медицинских технологий, которые могут привести к бессмертию

Вопросы читателей (ч. 8)

«Вместе на Марс»: реален ли совместный полет России и США на четвертую планету?

Вопросы читателей (ч. 1)

Новые алгоритмы ускоряют машинное обучение в децентрализованных сетях

По теме

Простой метод оценки неопределенности в машинном обучении оказался точным и менее затратным

Алгоритмы машинного обучения помогут точнее оценивать будущее российских компаний

Разработан эффективный «оптимистичный» алгоритм для обучения с подкреплением

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 66

ПНИПУ

ФизТех

НИУ ВШЭ

Сколтех

ТюмГУ

РНФ

ЮФУ

МГППУ

РТУ МИРЭА

НИТУ МИСИС

Хотите
вести колонку
в нашем
издании?