В НИУ ВШЭ разобрались в плюсах и минусах open-source GPU-технологий для суперкомпьютеров
Исследователи Международной лаборатории суперкомпьютерного атомистического моделирования и многомасштабного анализа НИУ ВШЭ, ОИВТ РАН и МФТИ сравнили работу популярных программ молекулярного моделирования на GPU-ускорителях AMD и Nvidia. Ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. В этой развивающейся технологии увидели большие перспективы, поскольку она позволяет эффективно использовать единый код и на ускорителях Nvidia, и на новых GPU компании AMD.
В опубликованной работе в журнале International Journal of High Performance Computing Applications ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. Исследователи провели детальный анализ производительности трех программ для молекулярного моделирования LAMMPS, Gromacs и OpenMM на GPU-ускорителях Nvidia и AMD с сопоставимыми пиковыми характеристиками.
Для тестов ученые использовали модели белка ApoA1 — Аполипопротеин A1 — аполипопротеин плазмы крови, основной белок носителя «хорошего холестерина». Выяснилось, что на производительность научных расчетов влияют не только характеристики аппаратного обеспечения, но и программное окружение. Оказалось, что недостаточно эффективная работа драйверов AMD в сложных сценариях параллельного запуска вычислительных ядер может вносить значительные задержки. Open-source решения имеют пока свои минусы.
В опубликованной работе ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. В этой развивающейся технологии увидели большие перспективы, поскольку она позволяет эффективно использовать единый код и на ускорителях Nvidia, и на новых GPU компании AMD. Разработанная модификация LAMMPS опубликована под открытой лицензией и доступна в официальном репозитории – пользователи по всему миру могут использовать эту разработку для ускорения своих расчетов.
«Мы провели детальный анализ и сравнение подсистем памяти GPU-ускорителей архитектур Nvidia Volta и AMD Vega20. Я обнаружил разницу в логике параллельного запуска GPU ядер и продемонстрировал ее с помощью визуализации профилей программы. И пропускная способность, и задержки иерархии внутренней памяти GPU-ускорителя, и эффективное параллельное выполнение GPU-ядер — все это оказывает очень большое влияние на реальную производительность GPU-программ», — говорит один из авторов статьи, аспирант НИУ ВШЭ Всеволод Никольский. По мнению авторов статьи, участие в этой технологической гонке титанов современной микроэлектроники демонстрирует очевидную тенденцию к увеличению разнообразия технологий GPU-ускорителей.
«С одной стороны, это позитивный для конечных пользователей факт, стимулирующий конкуренцию, повышение эффективности и снижение стоимости суперкомпьютеров. С другой стороны, сложность разработки эффективных программ для гибридных вычислительных систем еще больше усилится в результате необходимости учитывать наличие нескольких различных типов GPU-архитектур и технологий программирования, — комментирует профессор ВШЭ Владимир Стегайлов.
— Даже поддержка переносимости программ для обычных процессоров на различных архитектурах (x86, Arm, POWER) часто оказывается нетривиальной. Переносимость программ между различными GPU-платформами – вопрос намного более сложный. Open-source парадигма устраняет многие барьеры и помогает разработчикам больших и сложных суперкомпьютерных программ».
В 2020 году усилился дефицит на рынке графических ускорителей. Хорошо известны популярные области их использования: майнинг криптовалют и задачи машинного обучения. Однако GPU-ускорители нужны и в науке для математического моделирования новых материалов и биологических молекул. «Создание мощных суперкомпьютеров и разработка быстрых и эффективных программ — это подготовка инструментов для решения сложнейших общемировых вызовов, таких как пандемия COVID-19. Вычислительные инструменты для молекулярного моделирования используются сегодня во всем мире для поиска путей борьбы с этим вирусом», — говорит один из авторов статьи, научный сотрудник НИУ ВШЭ Николай Кондратюк.
Важнейшие программы для математического моделирования разрабатываются международными коллективами и учеными из десятков организаций. Разработка ведется с открытым исходным кодом и под свободными лицензиями. Конкуренция двух титанов современной микроэлектроники Nvidia и AMD привела к появлению новой open-source инфраструктуры AMD ROCm для программирования GPU-ускорителей.
Открытость платформы позволяет надеяться на максимальную переносимость кодов, разработанных с ее использованием, на суперкомпьютеры самых разных типов. Подобная стратегия AMD отличается от похода компании Nvidia, чья технология CUDA является закрытым стандартом.
Отклик научного сообщества не заставил себя ждать. Близятся к завершению проекты создания новых крупнейших суперкомпьютеров, использующих GPU-ускорители AMD. Полным ходом идет строительство суперкомпьютера Lumi в Финляндии с производительностью 0.5 экзафлопс (что эквивалентно, например, суммарной производительности полутора миллионов ноутбуков). В этом же году в США появится в полтора раза более мощный суперкомпьютер Frontier (1,5 экзафлопс), а в 2023 году — еще более мощный El Capitan (2 экзафлопс).
Мужчина, отправившийся на утреннюю прогулку на юго-западе Норвегии, случайно сделал крайне редкую и ценную находку — золотое украшение для ножен меча в виде переплетенных между собой змееподобных существ. По мнению ученых, в VI веке нашей эры этот артефакт специально поместили в трещину в скале в качестве подношения богам во времена голода и социальных потрясений.
Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Канадские исследователи идентифицировали останки четырех членов пропавшей полярной экспедиции Джона Франклина 1845 года, сравнив их ДНК с генетическим материалом современных потомков. Открытие решило полуторавековую загадку с переодетым матросом и помогло восстановить маршрут отступления экипажа по льдам. Выяснилось, что при эвакуации моряки разделились по кораблям, после чего бросили ослабевших товарищей в спасательных шлюпках.
Генетика интеллекта сложна и связана с разными психоневрологическими состояниями. Оказалось, то, что повышает эрудицию, может ухудшать способность решать творческие задачи, — и наоборот. Причем паттерны этих связей уникальны для каждого диагноза.
Мужчина, отправившийся на утреннюю прогулку на юго-западе Норвегии, случайно сделал крайне редкую и ценную находку — золотое украшение для ножен меча в виде переплетенных между собой змееподобных существ. По мнению ученых, в VI веке нашей эры этот артефакт специально поместили в трещину в скале в качестве подношения богам во времена голода и социальных потрясений.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
