В НИУ ВШЭ разобрались в плюсах и минусах open-source GPU-технологий для суперкомпьютеров
Исследователи Международной лаборатории суперкомпьютерного атомистического моделирования и многомасштабного анализа НИУ ВШЭ, ОИВТ РАН и МФТИ сравнили работу популярных программ молекулярного моделирования на GPU-ускорителях AMD и Nvidia. Ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. В этой развивающейся технологии увидели большие перспективы, поскольку она позволяет эффективно использовать единый код и на ускорителях Nvidia, и на новых GPU компании AMD.
В опубликованной работе в журнале International Journal of High Performance Computing Applications ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. Исследователи провели детальный анализ производительности трех программ для молекулярного моделирования LAMMPS, Gromacs и OpenMM на GPU-ускорителях Nvidia и AMD с сопоставимыми пиковыми характеристиками.
Для тестов ученые использовали модели белка ApoA1 — Аполипопротеин A1 — аполипопротеин плазмы крови, основной белок носителя «хорошего холестерина». Выяснилось, что на производительность научных расчетов влияют не только характеристики аппаратного обеспечения, но и программное окружение. Оказалось, что недостаточно эффективная работа драйверов AMD в сложных сценариях параллельного запуска вычислительных ядер может вносить значительные задержки. Open-source решения имеют пока свои минусы.
В опубликованной работе ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. В этой развивающейся технологии увидели большие перспективы, поскольку она позволяет эффективно использовать единый код и на ускорителях Nvidia, и на новых GPU компании AMD. Разработанная модификация LAMMPS опубликована под открытой лицензией и доступна в официальном репозитории – пользователи по всему миру могут использовать эту разработку для ускорения своих расчетов.
«Мы провели детальный анализ и сравнение подсистем памяти GPU-ускорителей архитектур Nvidia Volta и AMD Vega20. Я обнаружил разницу в логике параллельного запуска GPU ядер и продемонстрировал ее с помощью визуализации профилей программы. И пропускная способность, и задержки иерархии внутренней памяти GPU-ускорителя, и эффективное параллельное выполнение GPU-ядер — все это оказывает очень большое влияние на реальную производительность GPU-программ», — говорит один из авторов статьи, аспирант НИУ ВШЭ Всеволод Никольский. По мнению авторов статьи, участие в этой технологической гонке титанов современной микроэлектроники демонстрирует очевидную тенденцию к увеличению разнообразия технологий GPU-ускорителей.
«С одной стороны, это позитивный для конечных пользователей факт, стимулирующий конкуренцию, повышение эффективности и снижение стоимости суперкомпьютеров. С другой стороны, сложность разработки эффективных программ для гибридных вычислительных систем еще больше усилится в результате необходимости учитывать наличие нескольких различных типов GPU-архитектур и технологий программирования, — комментирует профессор ВШЭ Владимир Стегайлов.
— Даже поддержка переносимости программ для обычных процессоров на различных архитектурах (x86, Arm, POWER) часто оказывается нетривиальной. Переносимость программ между различными GPU-платформами – вопрос намного более сложный. Open-source парадигма устраняет многие барьеры и помогает разработчикам больших и сложных суперкомпьютерных программ».
В 2020 году усилился дефицит на рынке графических ускорителей. Хорошо известны популярные области их использования: майнинг криптовалют и задачи машинного обучения. Однако GPU-ускорители нужны и в науке для математического моделирования новых материалов и биологических молекул. «Создание мощных суперкомпьютеров и разработка быстрых и эффективных программ — это подготовка инструментов для решения сложнейших общемировых вызовов, таких как пандемия COVID-19. Вычислительные инструменты для молекулярного моделирования используются сегодня во всем мире для поиска путей борьбы с этим вирусом», — говорит один из авторов статьи, научный сотрудник НИУ ВШЭ Николай Кондратюк.
Важнейшие программы для математического моделирования разрабатываются международными коллективами и учеными из десятков организаций. Разработка ведется с открытым исходным кодом и под свободными лицензиями. Конкуренция двух титанов современной микроэлектроники Nvidia и AMD привела к появлению новой open-source инфраструктуры AMD ROCm для программирования GPU-ускорителей.
Открытость платформы позволяет надеяться на максимальную переносимость кодов, разработанных с ее использованием, на суперкомпьютеры самых разных типов. Подобная стратегия AMD отличается от похода компании Nvidia, чья технология CUDA является закрытым стандартом.
Отклик научного сообщества не заставил себя ждать. Близятся к завершению проекты создания новых крупнейших суперкомпьютеров, использующих GPU-ускорители AMD. Полным ходом идет строительство суперкомпьютера Lumi в Финляндии с производительностью 0.5 экзафлопс (что эквивалентно, например, суммарной производительности полутора миллионов ноутбуков). В этом же году в США появится в полтора раза более мощный суперкомпьютер Frontier (1,5 экзафлопс), а в 2023 году — еще более мощный El Capitan (2 экзафлопс).
Хотя сам факт наличия непонятных объектов на снимках, которые американские астронавты сделали на Луне, известен давно, десятилетиями их списывали на химические дефекты светочувствительной эмульсии фотопленки или блики света в линзах камер. Новая публикация на сайте Пентагона признает их реально существующими объектами, хотя и не делает выводов о их природе.
Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.
Десятого мая 1940 года вермахт пришел в движение. Через 42 суток англо-французские армии были разгромлены, а Франция капитулировала. Как это произошло, ведь союзники имели больше солдат, танков и пушек, чем немцы? В СССР причиной посчитали нежелание французов воевать, немцы же, говорили советские военные, не внесли в стратегию ничего нового. Реальность была строго обратной: разгром Франции был новым словом в войне, и такой же сценарий Гитлер применил против СССР через год. Что именно произошло и отчего советское руководство не смогло осознать случившееся?
Нейробиологи СПбГУ продемонстрировали, что активация рецептора следовых аминов TAAR1 эффективно подавляет агрессивное поведение, вызванное полным отсутствием серотонина в мозге. В дальнейшем этот результат поможет в разработке лекарственных препаратов, направленных на коррекцию патологических форм агрессии, возникающих при посттравматическом стрессовом расстройстве (ПТСР) и шизофрении.
Крупные травоядные утконосые майазавры известны своим развитым социальным поведением. Они жили семьями и строили гнезда для своих детенышей. Даже название вида переводится с греческого языка как «ящер — хорошая мать». Исследование окаменелых зубов майазавров показало, что они выращивали детенышей совсем не так, как это считалось типичным для животных глубокой древности.
Астрономы впервые использовали гравитационные волны, чтобы косвенно оценить параметры одного из ключевых процессов термоядерного горения в массивных светилах. Именно от него зависит, какие звезды взрываются, какие превращаются в черные дыры и как во Вселенной появляются углерод и кислород — элементы, без которых не было бы ни планет, ни жизни.
В последнее время пуски с российских северных космодромов осуществляют без предварительного уведомления, чего не было в прошлом. Вероятно, дело в недавно упомянутых главой «Роскосмоса» атаках на Плесецк во время пуска. Сегодняшний запуск обеспечил вывод на орбиту космических аппаратов военного назначения.
Химические связи в материале, из которого сделана электроника, разрываются не из-за накопительного износа от протекания тока через них, а из-за электронов с конкретной энергией.
Термоядерные электростанции не смогут конкурировать по цене с возобновляемыми источниками энергии из-за медленного удешевления технологии. По расчетам, расходы на каждую новую установку падали максимум на 8% — много раз ниже ранних ожиданий венчурных инвесторов. Это перечеркивает экономический смысл финансовых вливаний, и мир может никогда не увидеть дешевой термоядерной энергии.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
