24.12.2024, 14:48

ФизТех

Создан новый алгоритм, ускоряющий машинное обучение в распределенных системах без центрального сервера

❋ 4.4

Исследователи из России вместе с их американским коллегой предложили новый, полностью децентрализованный алгоритм оптимизации. Он позволяет эффективно решать различные задачи, работая без центрального сервера и автоматически настраиваясь без предварительной настройки параметров.

ФизТех

# Алгоритм

# машинное обучение

# операторы

# центральный сервер

Зависимость достигаемой точности от количества итераций для разных алгоритмов в задаче гребневой регрессии на разных графах: (1a) Линейный граф; (1b) Граф Эрдеша—Реньи с вероятностью активации ребра p = 0,1; (1c) Граф Эрдеша—Реньи с вероятностью активации ребра p = 0,5 / © NeurIPS 2024

Результаты исследования опубликованы в материалах конференции NeurIPS 2024. В современном мире множество задач решается в распределенных системах, где множество компьютеров (агентов) работают совместно. Традиционно такие системы используют центральный сервер для координации вычислений, что создает узкие места и проблемы с масштабируемостью.

Существующие децентрализованные алгоритмы оптимизации страдают от серьезного недостатка: для их эффективной работы необходимо точно знать параметры как самой задачи оптимизации (например, «константу Липшица» градиента, характеризующую крутизну функции потерь), так и топологии сети, по которой общаются агенты (степень их взаимосвязи). В реальных распределенных системах агенты обычно не имеют доступа к этой глобальной информации, что заставляет использовать очень консервативные настройки параметров и, как следствие, приводит к медленной сходимости или даже расходимости алгоритма. Это похоже на то, как если бы строители пытались построить дом, не зная ни плана здания, ни того, где находится строительный материал.

Однако новый подход, представленный в исследовании, решает эту проблему, предлагая полностью децентрализованный алгоритм оптимизации, работающий без центрального сервера и автоматически настраивающийся без необходимости в предварительной настройке параметров.

Он основан на методе «разбиения операторов» и использовании новой переменной метрики. Это позволяет каждому агенту самостоятельно определять оптимальный размер шага в процессе обучения, используя локальную информацию. Это подобно тому, как опытный строитель, оценивая ситуацию на месте, решает, какой инструмент и как использовать.

Вместо того, чтобы опираться на предварительно заданные параметры, алгоритм постоянно адаптируется к местным особенностям функции потерь. Каждый агент выполняет локальный поиск оптимального шага, не требуя обмена информацией со всеми остальными агентами в сети. Этот «локальный» подход значительно ускоряет вычисления и делает алгоритм более масштабируемым.

Теоретический анализ показал, что новый алгоритм обеспечивает линейную сходимость – это значит, что скорость приближения к решению остается высокой даже на поздних этапах вычислений. Скорость сходимости зависит от двух факторов: сложности самой задачи оптимизации и «связности» сети, то есть того, насколько хорошо агенты обмениваются информацией между собой. В хорошо связанных сетях скорость сходимости приближается к скорости централизованного алгоритма. Это как если бы все строители работали на одном участке, а не по всему городу.

Авторы предложили две модификации своего алгоритма. Оба алгоритма являются децентрализованными и используют локальный линейный поиск для адаптивного выбора размера шага каждым агентом индивидуально. Однако механизм согласования этих локальных размеров шага различен. Первый алгоритм использует механизм поиска глобального минимума. Каждый агент вычисляет свой локальный оптимальный размер шага, а затем все агенты обмениваются этой информацией, и в качестве глобального размера шага выбирается минимальное значение среди всех агентов, что требует коммуникации между всеми агентами в сети. Второй алгоритм основан на использовании только локального минимума. Каждый агент вычисляет свой локальный оптимальный размер шага, а затем выбирает в качестве своего размера шага минимум среди своих непосредственных соседей, включая самого себя. Это требует коммуникации только с соседями в сети.

В итоге первый алгоритм обеспечивает более быструю сходимость за счет использования глобальной информации о размере шага, но требует большей коммуникации между агентами. Второй алгоритм, в свою очередь, менее требователен к коммуникации, обмениваясь информацией только с ближайшими соседями, но за счет этого может демонстрировать несколько более медленную сходимость (хотя авторы показывают, что разница не слишком велика). Выбор между алгоритмами зависит от компромисса между скоростью сходимости и объемом коммуникации в конкретной сети. Второй алгоритм особенно полезен для сетей с ограниченной пропускной способностью или высокой стоимостью коммуникации.

Численные эксперименты подтвердили теоретические выводы о том, что новые алгоритмы значительно превосходит по скорости существующие децентрализованные алгоритмы. Эта разница особенно заметна при решении сложных задач с большим количеством данных и при работе в слабо связанных сетях. Алгоритм был успешно протестирован на задаче гребневой регрессии (ridge regression) — распространенной задаче машинного обучения.

«Наш подход использует метод разбиения операторов с новой переменной метрикой, что позволяет использовать локальный поиск по линиям с обратным шагом (backtracking line-search) для адаптивного выбора размера шага без глобальной информации или обширной коммуникации, — рассказал Александр Гасников, заведующий лабораторией математических методов оптимизации МФТИ. — Это приводит к благоприятным гарантиям сходимости и зависимости от параметров оптимизации и сети по сравнению с существующими неадаптивными методами. Примечательно, что новый метод является первым адаптивным децентрализованным алгоритмом, который достигает линейной сходимости для сильно выпуклых и гладких функций».

Дальнейшие исследования ученых могут быть направлены на адаптацию предложенных методов к стохастических задачам, расширение его на более сложные типы сетевых топологий и обмен данными, исследование возможностей использования более сложных методов оптимизации в рамках предложенного подхода. Разработка и улучшение новых алгоритмов децентрализованного машинного обучения является важным шагом к созданию более эффективных и масштабируемых систем машинного обучения в распределенных средах.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Московский физико-технический институт (национальный исследовательский университет), известен также как Физтех — ведущий российский вуз по подготовке специалистов в области теоретической, экспериментальной и прикладной физики, математики, информатики, химии, биологии и смежных дисциплин. Расположен в городе Долгопрудном Московской области, отдельные корпуса и факультеты находятся в Жуковском и в Москве.

ФизТех

# Алгоритм

# машинное обучение

# операторы

# центральный сервер

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Космическая импровизация: как Солнце создает хаос и порядок

Сколтех

Москва

Экскурсия

12 Июл

Бесплатно

Экскурсия в Музей Истории Мироздания

Курилка Гутенберга

Москва

Лекция

12 Июл

1700 ₽

Путешествие с кошкой Шредингера по квантовой запутанности: от параллельных вселенных до квантового компьютера

ВСмысле

Санкт-Петербург

Лекция

12 Июл

Бесплатно

Свет в ловушке: резонансные эффекты в наномасштабе

Сколтех

Москва

Лекция

12 Июл

700 ₽

Партия социалистов-революционеров: портреты

Центр «Архэ»

Москва

Лекция

12 Июл

Бесплатно

Звериный взгляд на красоту

Сколтех

Москва

Лекция

12 Июл

Бесплатно

Наука и искусство измерения времени

Сколтех

Москва

Лекция

13 Июл

Бесплатно

Органическая химия азота для медицины и освоения космоса

Космонавтика и авиация

Москва

Лекция

13 Июл

Бесплатно

Насколько огромна Вселенная?

Космонавтика и авиация

Москва

Популярное

За сутки

За неделю

За месяц

9 июля, 08:26

Полина Меньшова

Предпочтения в спорте связали с типом личности

Подобрать тип физической активности, который лучше всего подходит человеку, можно исходя из особенностей его характера. Психологи из Великобритании определили, что люди с разными чертами личности получают больше удовольствия от разных видов спорта.

Психология

# спорт

# тип личности

# фитнес

# характер

# черты личности

11 июля, 17:47

Денис Яковлев

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Международная команда ученых оценила связь между длительностью физической активности, ее интенсивностью, риском смерти от всех причин и вероятностью развития сердечно-сосудистых и онкологических заболеваний.

Медицина

# ЗОЖ

# онкологические заболевания

# сердечно-сосудистые болезни

# смертность

# спорт

11 июля, 10:30

ПНИПУ

Ученые впервые за 25 лет зафиксировали в России малоизученную болезнь Пика

В России от деменции страдает 1,5-1,8 миллиона человек. Распространенные формы — болезнь Альцгеймера, сосудистая, алкогольная деменции и так далее. Однако существует и малоизученная разновидность — деменция Пика. Она опасна тем, что поражает пациентов в относительно раннем возрасте, до 60 лет. Но из-за сложной диагностики и схожести симптомов с другими видами деменции часто остается не выявленной. Точных данных по России нет, так как заболевание редко фиксируется. Ученые Пермского Политеха и ПГМУ имени Вагнера провели морфологическое исследование мозга пациентки с симптомами деменции и подтвердили болезнь Пика. Это первое подобное исследование за 25 лет, которое поможет в диагностике и изучении заболевания.

ПНИПУ

# болезнь Альцгеймера

# болезнь Пика

# деменция

# диагноз

8 июля, 09:23

Полина Меньшова

Люди с высоким уровнем интеллекта оказались менее нравственными

Принято считать, что люди с развитыми когнитивными способностями отличаются высокими моральными принципами. Ученые из Великобритании решили проверить этот тезис научными методами и пришли к противоположному выводу.

Психология

# интеллект

# мораль

# нравственность

# показатель IQ

9 июля, 08:26

Полина Меньшова

Предпочтения в спорте связали с типом личности

Психология

# спорт

# тип личности

# фитнес

# характер

# черты личности

9 июля, 12:05

Редакция Naked Science

За месяц «ВКонтакте» покинули больше миллиона авторов

В июне 2025 года ВК покинули 1,2 миллиона авторов контента. Это резкое ускорение их бегства в сравнении с предшествующими месяцами. Одновременно число авторов на других платформах растет, в результате по этому показателю соцсеть обогнал не только Telegram, но и запрещенный Instagram*. Причиной происходящего многие наблюдатели посчитали совокупность решений менеджмента компании за последние годы.

Медиа

# «ВКонтакте»

# медиа

# соцсети

17 июня, 16:49

Адель Романова

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

Астрономия

# космический мусор

# космос

# радиосигналы

# спутники

25 июня, 15:19

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

2 июля, 11:17

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

[miniorange_social_login]

Создан новый алгоритм, ускоряющий машинное обучение в распределенных системах без центрального сервера

По теме

Алгоритм российских ученых нашел бенефициаров компаний с запутанной структурой

Нейросеть «оживила» «Мону Лизу»

Машинное обучение помогло изучить метаболические процессы

Популярное

Предпочтения в спорте связали с типом личности

Ученые определили оптимальную длительность физической активности, которая продлевает жизнь на треть

Ученые впервые за 25 лет зафиксировали в России малоизученную болезнь Пика

Люди с высоким уровнем интеллекта оказались менее нравственными

Предпочтения в спорте связали с типом личности

За месяц «ВКонтакте» покинули больше миллиона авторов

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Коров покормили отходами конопли и проверили их молоко на психоактивность

Комментарии

Хотите
вести колонку
в нашем
издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Новый золотой стандарт не нужен? Что пошло не так с привязкой рубля к желтому металлу

Автоматы в космосе: никаких перспектив замены человека

Маск раскрыл детали об электрофуре Tesla — и, похоже, она станет главным гвоздем, забитым в гроб дизельных грузовиков. Как именно это изменит мир?

Нестандартные уравнения: как искусственный интеллект ищет мельчайшие иголки в гигантском стоге сена научных возможностей

«Чтобы летать, нужны мозги». Разговор за жизнь с энтомологом Алексеем Полиловым

Артем Фуганов: «Умершие „неправильной“ смертью у славян становились ходячими мертвецами»

Сдвинуть звезду с места: как китайский космический телескоп будет искать Землю 2.0

Лошадь стала домашней только один раз

Создан новый алгоритм, ускоряющий машинное обучение в распределенных системах без центрального сервера

По теме

Алгоритм российских ученых нашел бенефициаров компаний с запутанной структурой

Нейросеть «оживила» «Мону Лизу»

Машинное обучение помогло изучить метаболические процессы

Популярное

Комментарии

Хотите вести колонку в нашем издании?

Колумнисты 64

ПНИПУ

ФизТех

Сколтех

НИУ ВШЭ

ТюмГУ

РНФ

ЮФУ

МГППУ

НИТУ МИСИС

КНЦ РАН

Хотите
вести колонку
в нашем
издании?