Уведомления
Авторизуйтесь или зарегистрируйтесь, чтобы оценивать материалы, создавать записи и писать комментарии.
Авторизуясь, вы соглашаетесь с правилами пользования сайтом и даете согласие на обработку персональных данных.
Российские ученые открыли самый эффективный алгоритм для обучения ИИ
Ученые из лаборатории исследований искусственного интеллекта Tinkoff Research создали самый эффективный среди своих аналогов алгоритм обучения и адаптации ИИ. Новый метод, названный ReBRAC, обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением.
Сегодня в мире идет что-то вроде гонки систем искусственного интеллекта, периодически подхлестываемой известными инфоповодами последних лет — например, об использовании нейросетей для диагностики тяжелых болезней или об их коммерческих применениях (ChatGPT и ему подобные). Вся эта гонка, однако, сталкивается с серьезными ограничениями: «железо» для ИИ очень требовательное, в первую очередь к видеокартам. Ведущий производитель микросхем, без которых тут не обойтись, тайваньский TSMC, не справляется со спросом на рынке, а его конкуренты по объему делают еще меньше.
В связи с этим разработка российских ученых в области повышения эффективности алгоритмов обучения ИИ может способствовать преодолению технологического и цифрового разрыва в мире между разными странами: более эффективные алгоритмы требуют меньше вычислительных ресурсов. Государства с ограниченными вычислительными мощностями смогут создавать и развивать передовые технологии, адаптировать ИИ под конкретные прикладные задачи, существенно экономя на дорогостоящих экспериментах с ним.
Результаты своей последней работы исследователи представили на международной конференции по машинному обучению и нейровычислениям NeurIPS (The Conference and Workshop on Neural Information Processing Systems). Она прошла с 10 по 16 декабря 2023 года в Новом Орлеане (США). Алгоритм ReBRAC (Revisited Behavior Regularized Actor Critic — «пересмотренный актор-критик с контролируемым поведением») ранее описали в препринте соответствующей работы.

В типичных ИИ-агентах есть два компонента: «актор», действующее лицо, генерирующее выдачу программы, и «критик», который оценивает действия актора по определенной шкале. Ориентируясь на эти оценки, актор со временем меняет свое поведение.
В новой работе ученые применили совместную регуляризацию обоих компонентов, чтобы актор избегал нежелательных действий, а критик, со своей стороны, точнее оценивал их. По отдельности оба улучшения пытались применять и раньше, но до сих пор не получалось сочетать оба подхода с наибольшей эффективностью.
Помимо этого, авторы нового алгоритма увеличили глубину нейронных сетей, используемых в ИИ, что облегчило ей работу с данными и поиск сложных закономерностей в них. Также они повысили эффективность горизонта планирования, изменив модель обучения так, чтобы она учитывала и краткосрочные, и долгосрочные задачи. Для стабилизации результатов обучения (а они часто и непредсказуемо колеблются, иногда даже в зависимости от времени года) исследователи использовали нормализацию слоев нейросети (LayerNorm)
Интегрировав все эти решения в алгоритм-предшественник BRAC от 2019 года, исследователи затем поочередно варьировали параметры каждого нового компонента системы. В итоге им удалось найти такой баланс модификаций, при которых этот уже довольно старый подход четырехлетней давности смог (в форме ReBRAC) показать самую высокую производительность среди всех известных на сегодня аналогов.
Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.
Результаты нового исследования разошлись с распространенным представлением о том, что наличие собаки, кошки или другого домашнего компаньона безусловно положительно влияет на благополучие людей. В некоторых случаях возможен негативный эффект.
Международная группа физиков из России (включая ученых ТГУ), Казахстана и Японии экспериментально зафиксировала необычное явление: стрела, движущаяся прямолинейно, оставляет за собой след в форме винтовой спирали. Это противоречит классическим представлениям, но было подтверждено в эксперименте с переходным излучением. Открытие меняет существующие взгляды на природу закрученного света и имеет значительные перспективы как для фундаментальных исследований, так и для прикладных технологий.
Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.
За последние 30 лет размер трески, обитающей в Балтийском море, значительно уменьшился. Если раньше рыбаки вылавливали из воды особей размером с маленького ребенка, то теперь добытая рыба легко помещается в ладонях. Авторы нового исследования винят в этом человека, который заставил один из видов эволюционировать в «карликов».
Объект 3I/ATLAS, обнаруженный в начале июля примерно в 675 миллионах километров от Солнца, принадлежит к потенциально самому опасному для землян типу небесных тел. К счастью, этот конкретный объект хотя и имеет опасные размеры, но нашей планете никак не угрожает.
Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.
Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.
Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Комментарии