Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Ученые упростили эксперименты в физике элементарных частиц
Исследователи Центра искусственного интеллекта НИУ ВШЭ разработали новый метод оценки надежности моделей машинного обучения. Они показали, что подход работает в восемь раз быстрее, чем полный перебор моделей, и существенно снижает объем ручной проверки. Метод можно использовать в задачах физики элементарных частиц с нейросетями различной архитектуры.
Чтобы проще и быстрее анализировать экспериментальные данные, в физике элементарных частиц все чаще используют машинное обучение и искусственный интеллект. Например, нейросети помогают обрабатывать сигналы приборов и восстанавливать недостающие данные о свойствах частиц. Такие предсказания влияют на дальнейший анализ, поэтому необходимо знать их надежность. При этом часто оценивается только точность модели и редко учитывается, насколько сильно меняются ее результаты при повторных обучениях. Особенно это заметно в работе с глубокими нейросетями: их поведение сложно интерпретировать, и результаты разных запусков обучения могут расходиться. Поэтому, несмотря на потенциальную пользу применения нейросетей, многие физики относятся к ним с недоверием.
Ученые Центра ИИ НИУ ВШЭ предложили свое решение. Они разработали метод, который автоматически сравнивает десятки вариантов нейросетей и отбирает среди них наиболее надежные и устойчивые. Идея следующая: если модель каждый раз по-новому обучать на слегка измененных данных и с разными начальными весами, то разброс ошибок покажет, насколько уверенно она работает при небольших изменениях условий. Устойчивая модель в таких испытаниях будет давать почти одинаковый результат. Исследование опубликовано в журнале IEEE Access.
Исследователи проверяли метод на задаче, где по картинке из ячеек электромагнитного калориметра нужно определить, с какой энергией и в какую точку в детекторе попала частица. Электромагнитный калориметр — это устройство, состоящее из множества ячеек и измеряющее количество энергии в каждой ячейке после попадания частицы.
«Для анализа мы сгенерировали полмиллиона виртуальных сигналов, имитирующих работу детектора, и многократно прогнали их через разные модели, каждый раз меняя обучающие и тестовые выборки. Потом с помощью нашего метода выбрали самые надежные модели и исследовали их характеристики. Так мы оценили минимальный объем примеров, при котором модель становится робастной — устойчиво ведет себя при разных запусках», — рассказал ведущий научный сотрудник Научно-учебной лаборатории (НУЛ) методов анализа больших данных Института ИИ и цифровых наук НИУ ВШЭ Федор Ратников.
Ключевой элемент подхода — специальный алгоритм отбора. Для каждого варианта модели исследователи собирали набор ее ошибок, накопленный за десятки независимых запусков, и по этому распределению оценивали, насколько предсказуемо ведет себя модель. Такой подход позволяет автоматически отсеивать модели, которые случайно сделали хорошие предсказания, и выделять те, что работают стабильно при любых разумных изменениях условий.
«Все модели мы многократно обучали на полумиллионе событий симуляции калориметра, каждый раз по-новому деля данные на обучающую и тестовую части и задавая разные случайные начальные веса. Это позволило не только измерить, как часто ошибается модель, но и отследить, как она обучается от запуска к запуску», — пояснил сотрудник НУЛ методов анализа больших данных Института ИИ и цифровых наук Алексей Болдырев.
Исследование также показало, что модели, которым вместе с сырыми сигналами передают и простые заранее известные физические величины, обходятся меньшим количеством данных и быстрее выходят на устойчивый результат. Авторы оценили минимальный объем данных, при котором такие модели сохраняют качество от запуска к запуску, и выделили две стабильно точные и надежные архитектуры.
«Новый метод позволяет ускорить выбор надежных ИИ-моделей для решения некоторых задач физики элементарных частиц. И делает это в восемь раз быстрее, чем традиционный способ полного перебора всех вариантов», — отметил стажер-исследователь НУЛ методов анализа больших данных Института ИИ и цифровых наук Андрей Шевелев.
Исследователи подчеркнули, что алгоритм полностью автоматизирован и не требует ручной настройки. Благодаря этому его можно использовать как основу для самообучающихся систем, которые смогут стабильно работать вне зависимости от колебаний в обучающих данных и собственных ограничений моделей.
Энтомологи сравнили устойчивость коммерческих и диких гибридных медоносных пчел к главному паразиту ульев — клещу варроа. Полевые и лабораторные тесты показали, что гибриды заражаются в пять раз реже, поскольку их личинки не нравятся паразитам. Пчела-гибрид выживает без регулярных химических обработок и, что важно для пчеловодов, сохраняет миролюбивый характер.
Ученые давно знают как с хорошим приближением прогнозировать рост поверхностей. Но экспериментально подтвердить точное соответствие реальных процессов и модели — гораздо более сложная задача, у которой, тем не менее, есть решение.
На Меркурии может появиться первый в истории «вечный рассвет»: ученые предложили отправить туда планетоход, который будет постоянно ехать вдоль границы дня и ночи. Подход открывает путь к изучению одного из самых загадочных миров Солнечной системы без риска разрушительного перегрева.
Когда международная экспедиционная группа, исследующая море Уэдделла в Антарктиде на борту ледокола «Поларштерн», попыталась укрыться от шторма, ученые и экипаж судна удивились внезапному появлению острова, не обозначенного ни на одной морской карте.
Ученые давно знают как с хорошим приближением прогнозировать рост поверхностей. Но экспериментально подтвердить точное соответствие реальных процессов и модели — гораздо более сложная задача, у которой, тем не менее, есть решение.
Окаменелые остатки рептилии возрастом 289 миллионов лет сохранили полное анатомическое устройство грудной клетки ранних покорителей суши. Благодаря нетронутым хрящам исследователи реконструировали механику первого полноценного реберного дыхания. Наличие в тканях оригинальных белков подтвердило, что сложные органические молекулы способны сохраняться в палеонтологической летописи почти на 100 миллионов лет дольше, чем считалось.
В парках некоторых стран все чаще можно заметить странную картину: синицы и воробьи вместо пуха и веточек приносят в клювах сигаретные окурки. Орнитологи из Польши решили выяснить, зачем птицы выстилают гнезда мусором, пропитанным никотином. Оказалось, пернатые нашли способ использовать вредную человеческую привычку для защиты своего потомства. Но, как это часто бывает в природе, у медали есть обратная сторона.
Марсоход «Персеверанс» обнаружил в камнях на кромке кратера Езеро спектральные признаки минерала корунда, из которого на Земле образуются рубины и сапфиры. Такие спектры на Красной планете зарегистрировали впервые. Теперь ученые пытаются понять, при каких процессах он мог там сформироваться, ведь условия на Марсе заметно отличаются от тех, в которых корунд обычно образуется на Земле.
Четыре человека, летящие к Луне, столкнулись с целым рядом мелких неприятностей — от низкой температуры в начале работы до поломки мочевыводящей системы туалета на вторые сутки и необходимости взамен пользоваться пакетами. К счастью, пока самые крупные сложности удалось компенсировать. Но все они вместе могут сдвинуть ситуацию к решению, о котором Naked Science уже говорил в нашем видеоподкасте о миссии: не исключено, что при высадке астронавтов на Луне их корабль состыкуют со Starship не на окололунной, а уже на околоземной орбите.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
