• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
20.12.2024
ФизТех
291

Новые алгоритмы ускоряют машинное обучение в децентрализованных сетях

4.4

Международная команда ученых совершила прорыв в области распределенного машинного обучения, разработав новые алгоритмы, значительно повышающие эффективность обучения моделей в федеративных сетях. Исследование, проведенное группой, куда вошли специалисты МФТИ, представляет собой значительный шаг вперед в решении проблемы высокой вычислительной сложности обучения больших моделей в распределенных системах.

Сравнение новых четырех предложенных методов (Q-NASTYA, DIANA-NASTYA, Q-RR, DIANA-RR) и существующих (FedCOM, FedPAQ) с настроенными размерами шагов и компрессором Rand-k. / © NeurIPS 2024

Результаты опубликованы в материалах конференции NeurIPS 2024. Современное машинное обучение часто опирается на обучение моделей на огромных объемах данных, что требует распределенных вычислений. Федеративное обучение (Federated Learning, FL) — это подход, позволяющий обучать модели на децентрализованных данных, хранящихся на множестве устройств (смартфоны, медицинские приборы и так далее), без прямого обмена этими данными.

Ключевая проблема федеративного обучения заключается в высокой коммуникационной сложности. А именно передача данных и вычисление градиентов на основе них (векторов, характеризующих направление изменения параметров модели) становится проблемой, которая замедляет весь процесс обучения. Коммуникационная сложность заключается в огромном количестве передач данных по сети, необходимых для достижения заданной точности решения.

Обычно для решения этой проблемы используют стохастический градиентный спуск. Он основан на том, чтобы использовать неполную информацию для вычисления градиента, выбирая используемые данные для этого случайным образом. такие методы делятся на методы с возвращением и без возвращения. При выборе с возвращением один и тот же набор данных может быть выбран несколько раз, а при выборе без возвращения каждый набор данных выбирается только один раз.

В свежей статье, представленной на конференции NeurIPS 2024, авторы предлагают новые подходы. Они разработали четыре новых алгоритма, сочетающие сжатие градиентов с методом случайной перестановки и локальными вычислениями.


Сравнение алгоритмов Q-RR, QSGD, DIANA и DIANA-RR в задаче обучения глубокой нейронной сети / © NeurIPS 2024

Первый новый алгоритм они назвали Q-RR (Quantized Random Reshuffling). Это самый наивный подход, сочетающий сжатие градиентов и метод перестановки. К сожалению, теоретический анализ показал, что этот метод не демонстрирует преимуществ перед традиционными методами сжатия градиентов.

Второй предложенный учеными метод, названный ими DIANA-RR, является модификацией первого. Они улучшили предыдущий подход, добавив снижение дополнительной дисперсии, которая возникла из-за сжатия градиентов. В результате им удалось получить алгоритм, который имеет лучшую скорость сходимости, чем существующие аналоги, основанные на выборке с возвращением.

Для лучшей адаптации к задачам федеративного обучения ученые расширили алгоритмы Q-RR и DIANA-RR, добавив локальные вычислительные шаги. Так они получили ещё два новых метода, которые назвали Q-NASTYA и DIANA-NASTYA. Эти методы используют разные размеры шагов для локальных и глобальных обновлений. Однако при этом и DIANA-NASTYA, и DIANA-RR предназначены для уменьшения дополнительной дисперсии, вносимой сжатием градиентов.

Авторы исследования провели теоретический анализ и три численных эксперимента, которые подтвердили эффективность предложенных алгоритмов. Алгоритмы DIANA-RR и DIANA-NASTYA значительно превосходят по скорости сходимости существующие методы, особенно при высокой степени сжатия градиентов и в условиях, когда требуется высокая точность.

Для моделирования в первых двух экспериментах авторы использовали решение бинарной проблемы классификации (проверке принадлежности объектов к одному из двух классов) методом логистической регрессии с регуляризацией. В первых двух экспериментах они сравнивали между собой локальные и нелокальные методы.

Оказалось, что результаты, наблюдаемые в численных экспериментах, идеально соответствовали выведенной теории.

В третьем эксперименте авторы использовали нелокальные методы для распределенного машинного обучения глубокой нейронной сети, и в нем новые методы тоже показали свое преимущество над традиционными подходами.

«Многие существующие работы в области федеративного обучения рассматривают методы стохастического градиентного спуска с возвращением. Однако недавно удалось показать как теоретически, так и практически, что методы, основанные на выборке без возвращения, например, метод случайной перестановки, работают лучше», — рассказал Абдурахмон Садиев, научный сотрудник лаборатории численных методов прикладной структурной оптимизации ФПМИ МФТИ.

Разработанные алгоритмы представляют собой важный вклад в область федеративного обучения, позволяя существенно ускорить процесс обучения больших моделей при ограниченных коммуникационных ресурсах. Это открывает новые возможности для применения машинного обучения в различных областях, где важна защита конфиденциальности данных. Дальнейшие исследования будут направлены на оптимизацию алгоритмов и их адаптацию к более сложным задачам федеративного обучения.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
5 июня
Игорь Байдов

Когда у круглых червей наступают голодные времена или им становится тесно, они объединяют свои усилия, чтобы поменять среду обитания. Забираются друг на друга, образуя живые башни, которые устремляются вверх, где нематоды могут прицепиться к проходящему мимо животному и с его помощью добраться до более изобильных мест. Долгое время ученые лишь догадывались о существовании таких живых башен. Теперь команда исследователей из Германии впервые зафиксировала их в дикой природе.

Вчера, 13:23
Александр Березин

Илон Маск накинулся на Трампа за отказ от сокращения госрасходов, считая, что это ведет Америку к банкротству. А еще он заявил, что без него тот и к власти бы не пришел. В ответ Трамп предложил сократить госрасходы, лишив Маска всех контрактов. Между тем, именно контракты с ним — основа возвращения американцев на Луну в 2027-2028 годах. Что будет, если американский президент действительно решится на расторжение контрактов? И как это отразится на множественных полетах Starship к Марсу в 2020-х? Как ни странно, оба эти вопроса плотно затрагивают происходящее в нашей стране.

Позавчера, 10:47
ПНИПУ

Удаленные промышленные объекты и метеостанции в условиях Крайнего Севера или Дальнего Востока требуют автономного энергоснабжения. Вместо традиционных двигателей их оснащают установками, преобразующими химическую энергию топлива (водорода, метана, биогаза) в электричество и тепло через электрохимические реакции с помощью твердооксидных топливных элементов (ТОТЭ). Эти конструкции со специальными керамическими ячейками работают без сжигания топлива, что повышает их эффективность и экологичность. Ученые ПНИПУ разработали компактный высокотемпературный блок для ТОТЭ. Испытания показали, что он перерабатывает метан на 96%, подтверждая работоспособность системы.

5 июня
Игорь Байдов

Когда у круглых червей наступают голодные времена или им становится тесно, они объединяют свои усилия, чтобы поменять среду обитания. Забираются друг на друга, образуя живые башни, которые устремляются вверх, где нематоды могут прицепиться к проходящему мимо животному и с его помощью добраться до более изобильных мест. Долгое время ученые лишь догадывались о существовании таких живых башен. Теперь команда исследователей из Германии впервые зафиксировала их в дикой природе.

Вчера, 13:23
Александр Березин

Илон Маск накинулся на Трампа за отказ от сокращения госрасходов, считая, что это ведет Америку к банкротству. А еще он заявил, что без него тот и к власти бы не пришел. В ответ Трамп предложил сократить госрасходы, лишив Маска всех контрактов. Между тем, именно контракты с ним — основа возвращения американцев на Луну в 2027-2028 годах. Что будет, если американский президент действительно решится на расторжение контрактов? И как это отразится на множественных полетах Starship к Марсу в 2020-х? Как ни странно, оба эти вопроса плотно затрагивают происходящее в нашей стране.

Позавчера, 10:47
ПНИПУ

Удаленные промышленные объекты и метеостанции в условиях Крайнего Севера или Дальнего Востока требуют автономного энергоснабжения. Вместо традиционных двигателей их оснащают установками, преобразующими химическую энергию топлива (водорода, метана, биогаза) в электричество и тепло через электрохимические реакции с помощью твердооксидных топливных элементов (ТОТЭ). Эти конструкции со специальными керамическими ячейками работают без сжигания топлива, что повышает их эффективность и экологичность. Ученые ПНИПУ разработали компактный высокотемпературный блок для ТОТЭ. Испытания показали, что он перерабатывает метан на 96%, подтверждая работоспособность системы.

5 июня
Александр Березин

Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.

22 мая
ПНИПУ

Недавно вышел второй сезон сериала «Одни из нас» (TheLastofUs), созданного по сюжету популярнейшей видеоигры. Ученые Пермского Политеха решили разобраться, насколько реален сценарий грибной пандемии, превращающей людей зомби? Чем живет кордицепс и как он «ищет» своих жертв, действительно ли паразит способен эволюционировать настолько, чтобы поражать человеческий организм и подчинять себе его волю, был бы у людей шанс выжить, какие грибы уже поселились в наших телах и выручит ли нас иммунитет, сформированный тысячелетиями.

26 мая
Unitsky String Technologies Inc.

Казахстанский Алматы — город контрастов, где горы соседствуют с урбанистическими пейзажами, а бизнес-центры — с историческими кварталами. Неизменным остается одно — пробки. Ежедневно сюда приезжает более 700 тысяч автомобилей из пригородов, при этом в самом мегаполисе зарегистрировано порядка 600 тысяч транспортных средств. В результате по улицам ежедневно движется более миллиона транспортных средств.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Закрыть
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно