Ученые упростили эксперименты в физике элементарных частиц
Исследователи Центра искусственного интеллекта НИУ ВШЭ разработали новый метод оценки надежности моделей машинного обучения. Они показали, что подход работает в восемь раз быстрее, чем полный перебор моделей, и существенно снижает объем ручной проверки. Метод можно использовать в задачах физики элементарных частиц с нейросетями различной архитектуры.
Чтобы проще и быстрее анализировать экспериментальные данные, в физике элементарных частиц все чаще используют машинное обучение и искусственный интеллект. Например, нейросети помогают обрабатывать сигналы приборов и восстанавливать недостающие данные о свойствах частиц. Такие предсказания влияют на дальнейший анализ, поэтому необходимо знать их надежность. При этом часто оценивается только точность модели и редко учитывается, насколько сильно меняются ее результаты при повторных обучениях. Особенно это заметно в работе с глубокими нейросетями: их поведение сложно интерпретировать, и результаты разных запусков обучения могут расходиться. Поэтому, несмотря на потенциальную пользу применения нейросетей, многие физики относятся к ним с недоверием.
Ученые Центра ИИ НИУ ВШЭ предложили свое решение. Они разработали метод, который автоматически сравнивает десятки вариантов нейросетей и отбирает среди них наиболее надежные и устойчивые. Идея следующая: если модель каждый раз по-новому обучать на слегка измененных данных и с разными начальными весами, то разброс ошибок покажет, насколько уверенно она работает при небольших изменениях условий. Устойчивая модель в таких испытаниях будет давать почти одинаковый результат. Исследование опубликовано в журнале IEEE Access.
Исследователи проверяли метод на задаче, где по картинке из ячеек электромагнитного калориметра нужно определить, с какой энергией и в какую точку в детекторе попала частица. Электромагнитный калориметр — это устройство, состоящее из множества ячеек и измеряющее количество энергии в каждой ячейке после попадания частицы.
«Для анализа мы сгенерировали полмиллиона виртуальных сигналов, имитирующих работу детектора, и многократно прогнали их через разные модели, каждый раз меняя обучающие и тестовые выборки. Потом с помощью нашего метода выбрали самые надежные модели и исследовали их характеристики. Так мы оценили минимальный объем примеров, при котором модель становится робастной — устойчиво ведет себя при разных запусках», — рассказал ведущий научный сотрудник Научно-учебной лаборатории (НУЛ) методов анализа больших данных Института ИИ и цифровых наук НИУ ВШЭ Федор Ратников.
Ключевой элемент подхода — специальный алгоритм отбора. Для каждого варианта модели исследователи собирали набор ее ошибок, накопленный за десятки независимых запусков, и по этому распределению оценивали, насколько предсказуемо ведет себя модель. Такой подход позволяет автоматически отсеивать модели, которые случайно сделали хорошие предсказания, и выделять те, что работают стабильно при любых разумных изменениях условий.
«Все модели мы многократно обучали на полумиллионе событий симуляции калориметра, каждый раз по-новому деля данные на обучающую и тестовую части и задавая разные случайные начальные веса. Это позволило не только измерить, как часто ошибается модель, но и отследить, как она обучается от запуска к запуску», — пояснил сотрудник НУЛ методов анализа больших данных Института ИИ и цифровых наук Алексей Болдырев.
Исследование также показало, что модели, которым вместе с сырыми сигналами передают и простые заранее известные физические величины, обходятся меньшим количеством данных и быстрее выходят на устойчивый результат. Авторы оценили минимальный объем данных, при котором такие модели сохраняют качество от запуска к запуску, и выделили две стабильно точные и надежные архитектуры.
«Новый метод позволяет ускорить выбор надежных ИИ-моделей для решения некоторых задач физики элементарных частиц. И делает это в восемь раз быстрее, чем традиционный способ полного перебора всех вариантов», — отметил стажер-исследователь НУЛ методов анализа больших данных Института ИИ и цифровых наук Андрей Шевелев.
Исследователи подчеркнули, что алгоритм полностью автоматизирован и не требует ручной настройки. Благодаря этому его можно использовать как основу для самообучающихся систем, которые смогут стабильно работать вне зависимости от колебаний в обучающих данных и собственных ограничений моделей.
Ученые РТУ МИРЭА и Сибирского федерального университета создали программный комплекс, который анализирует учебные планы вузов быстрее секунды и находит в них слабые места. Большинство учебных планов содержат скрытые противоречия, дублирования и неочевидные перекосы в подготовке специалистов. Это важно, потому что от качества учебного плана напрямую зависит, какие реальные навыки получат студенты и насколько они будут востребованы работодателями.
Пяти постов на одну тему достаточно, чтобы сформировать мнение. Новое исследование показало, что убеждения в соцсетях фиксируются быстрее, чем включается критическое мышление.
Значение вилочковой железы (тимуса) для здоровья и долголетия, возможно, сильно недооценивалось. Как показали результаты двух новых исследований, нормально функционирующий во взрослом возрасте тимус — залог здорового старения, долгой жизни и высокой выживаемости при раке.
Исследователи опросили более 60 тысяч испытуемых из разных стран и выяснили: чем больше человек зациклен на себе, тем холоднее он к своему партнеру. Правда, снижение накала страстей не всегда плохо, у этого есть и положительные стороны.
Около четырех миллиардов лет назад Солнечная система пребывала в хаосе: гигантские планеты сближались, меняли орбиты и выбрасывали своих соседей в межзвездное пространство. Хотя шансы на «выживание» лун Юпитера и Урана в этот период были крайне малы, астрономы показали, что их судьба может хранить следы древней катастрофы с участием «потерянной» планеты.
Изучив данные о скорости изменения температур ледяных спутников пятой и шестой планеты системы, астрономы обнаружили, что она слишком высока для по-настоящему ледяной поверхности. Оказалось, что эти тела покрыты материалом, по своим свойствам резко отличающимся от земного льда.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
При совпадении нескольких условий наши глаза способны улавливать излучение в ближнем инфракрасном спектре. Тогда сетчатка начинает работать как нелинейный фотодетектор.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
