Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
В НИУ ВШЭ разобрались в плюсах и минусах open-source GPU-технологий для суперкомпьютеров
Исследователи Международной лаборатории суперкомпьютерного атомистического моделирования и многомасштабного анализа НИУ ВШЭ, ОИВТ РАН и МФТИ сравнили работу популярных программ молекулярного моделирования на GPU-ускорителях AMD и Nvidia. Ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. В этой развивающейся технологии увидели большие перспективы, поскольку она позволяет эффективно использовать единый код и на ускорителях Nvidia, и на новых GPU компании AMD.
В опубликованной работе в журнале International Journal of High Performance Computing Applications ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. Исследователи провели детальный анализ производительности трех программ для молекулярного моделирования LAMMPS, Gromacs и OpenMM на GPU-ускорителях Nvidia и AMD с сопоставимыми пиковыми характеристиками.
Для тестов ученые использовали модели белка ApoA1 — Аполипопротеин A1 — аполипопротеин плазмы крови, основной белок носителя «хорошего холестерина». Выяснилось, что на производительность научных расчетов влияют не только характеристики аппаратного обеспечения, но и программное окружение. Оказалось, что недостаточно эффективная работа драйверов AMD в сложных сценариях параллельного запуска вычислительных ядер может вносить значительные задержки. Open-source решения имеют пока свои минусы.
В опубликованной работе ученые впервые перенесли LAMMPS на новую open-source GPU-технологию AMD HIP. В этой развивающейся технологии увидели большие перспективы, поскольку она позволяет эффективно использовать единый код и на ускорителях Nvidia, и на новых GPU компании AMD. Разработанная модификация LAMMPS опубликована под открытой лицензией и доступна в официальном репозитории – пользователи по всему миру могут использовать эту разработку для ускорения своих расчетов.
«Мы провели детальный анализ и сравнение подсистем памяти GPU-ускорителей архитектур Nvidia Volta и AMD Vega20. Я обнаружил разницу в логике параллельного запуска GPU ядер и продемонстрировал ее с помощью визуализации профилей программы. И пропускная способность, и задержки иерархии внутренней памяти GPU-ускорителя, и эффективное параллельное выполнение GPU-ядер — все это оказывает очень большое влияние на реальную производительность GPU-программ», — говорит один из авторов статьи, аспирант НИУ ВШЭ Всеволод Никольский. По мнению авторов статьи, участие в этой технологической гонке титанов современной микроэлектроники демонстрирует очевидную тенденцию к увеличению разнообразия технологий GPU-ускорителей.
«С одной стороны, это позитивный для конечных пользователей факт, стимулирующий конкуренцию, повышение эффективности и снижение стоимости суперкомпьютеров. С другой стороны, сложность разработки эффективных программ для гибридных вычислительных систем еще больше усилится в результате необходимости учитывать наличие нескольких различных типов GPU-архитектур и технологий программирования, — комментирует профессор ВШЭ Владимир Стегайлов.
— Даже поддержка переносимости программ для обычных процессоров на различных архитектурах (x86, Arm, POWER) часто оказывается нетривиальной. Переносимость программ между различными GPU-платформами – вопрос намного более сложный. Open-source парадигма устраняет многие барьеры и помогает разработчикам больших и сложных суперкомпьютерных программ».
В 2020 году усилился дефицит на рынке графических ускорителей. Хорошо известны популярные области их использования: майнинг криптовалют и задачи машинного обучения. Однако GPU-ускорители нужны и в науке для математического моделирования новых материалов и биологических молекул. «Создание мощных суперкомпьютеров и разработка быстрых и эффективных программ — это подготовка инструментов для решения сложнейших общемировых вызовов, таких как пандемия COVID-19. Вычислительные инструменты для молекулярного моделирования используются сегодня во всем мире для поиска путей борьбы с этим вирусом», — говорит один из авторов статьи, научный сотрудник НИУ ВШЭ Николай Кондратюк.
Важнейшие программы для математического моделирования разрабатываются международными коллективами и учеными из десятков организаций. Разработка ведется с открытым исходным кодом и под свободными лицензиями. Конкуренция двух титанов современной микроэлектроники Nvidia и AMD привела к появлению новой open-source инфраструктуры AMD ROCm для программирования GPU-ускорителей.
Открытость платформы позволяет надеяться на максимальную переносимость кодов, разработанных с ее использованием, на суперкомпьютеры самых разных типов. Подобная стратегия AMD отличается от похода компании Nvidia, чья технология CUDA является закрытым стандартом.
Отклик научного сообщества не заставил себя ждать. Близятся к завершению проекты создания новых крупнейших суперкомпьютеров, использующих GPU-ускорители AMD. Полным ходом идет строительство суперкомпьютера Lumi в Финляндии с производительностью 0.5 экзафлопс (что эквивалентно, например, суммарной производительности полутора миллионов ноутбуков). В этом же году в США появится в полтора раза более мощный суперкомпьютер Frontier (1,5 экзафлопс), а в 2023 году — еще более мощный El Capitan (2 экзафлопс).
В нашу эпоху у США в космос летает три типа пилотируемых космических кораблей, причем только один пригоден для полета к Луне. Он же пока показал себя наиболее удобным из всех для длительных полетов. Астронавты столкнулись только с мелкими проблемами, которые удалось оперативно решить.
Единственной планетой Солнечной системы, подходящей для терраформирования, остается Марс. Однако способы разогреть его с помощью суперпарниковых газов требовали веков времени. Согласно расчетам из новой работы, микрочастицы особой формы могут сделать то же самое куда быстрее и дешевле.
Японские экологи непрерывно измеряли напряжение внутри 37 диких грибов и зафиксировали между ними направленный обмен электрическими сигналами. Локальный полив земли рядом с одним плодовым телом вызвал мгновенный всплеск передачи информации по всей подземной сети. Этот коммуникационный процесс объединил в единую структуру даже генетически чужеродные организмы.
Единственной планетой Солнечной системы, подходящей для терраформирования, остается Марс. Однако способы разогреть его с помощью суперпарниковых газов требовали веков времени. Согласно расчетам из новой работы, микрочастицы особой формы могут сделать то же самое куда быстрее и дешевле.
Морские биологи впервые детально задокументировали процесс родов у диких кашалотов. Анализ видеозаписей и акустических сигналов показал, что самки из разных родственных линий временно объединяются, чтобы по очереди выталкивать новорожденного на поверхность для дыхания. Это первое доказательство взаимопомощи при родах между неродственными особями у видов, не относящихся к приматам.
Связь разных культур всего мира иногда находится в самых неожиданных инструментах, в том числе в языке. Новое исследование впервые показало такую связь количественно.
Марсоход «Персеверанс» обнаружил в камнях на кромке кратера Езеро спектральные признаки минерала корунда, из которого на Земле образуются рубины и сапфиры. Такие спектры на Красной планете зарегистрировали впервые. Теперь ученые пытаются понять, при каких процессах он мог там сформироваться, ведь условия на Марсе заметно отличаются от тех, в которых корунд обычно образуется на Земле.
Одна сторона сыплет более дорогими и сложными баллистическими ракетами, другая — относительно дешевыми крылатыми. Но при этом первая на порядок беднее второй. А что у них с технологическим уровнем для наземной войны, и почему, кстати, глава второй избегает даже самого этого слова? Попробуем разобраться в реальных возможностях военных машин сторон потенциально самого опасного конфликта 2026 года.
Единственной планетой Солнечной системы, подходящей для терраформирования, остается Марс. Однако способы разогреть его с помощью суперпарниковых газов требовали веков времени. Согласно расчетам из новой работы, микрочастицы особой формы могут сделать то же самое куда быстрее и дешевле.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
