Российские ученые первыми в мире обучили ИИ самостоятельно адаптироваться к новым действиям
В прошлом ИИ-системы выполняли определенный набор задач, а при появлении новых их нужно было переобучать. На это уходили дополнительные финансовые и вычислительные ресурсы. Открытие лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI меняет ситуацию. Ученые первыми в мире создали модель в области контекстного обучения (In-Context Learning), которая на нескольких примерах сама может учиться новым действиям.
Модель, названная Headless-AD, способна выполнять в пять раз больше действий, чем в нее заложено при начальном обучении. Такого рода ИИ-системы, умеющие адаптироваться к изменениям среды и новым задачам без вмешательства людей, будут полезны во многих областях — от бытовых до связанных с космической отраслью.
В частности, подобные системы могут найти применение в домашних роботах-помощниках. Предварительно их можно будет обучать стандартному набору действий в доме. В дальнейшем, за счет заложенных в Headless-AD возможностей к самообучению, домашние роботы смогут подстраиваться под персональные нужды домохозяйств.
Еще один возможный сценарий — внедрение Headless-AD в беспилотных автомобилях. ИИ-модель позволит им адаптироваться к замене деталей на новые, причем даже с другим принципом работы. Пример — установка более мощного двигателя или нового типа шин.
Исследователи провели серию экспериментов, в которых сравнили Headless-AD с ближайшими аналогами. Одна из протестированных задач — составление рекомендаций к товарам. Другие модели требуют переобучения для новых групп товаров, а при увеличении их количества теряют в качестве. Headless-AD показала преимущество, поскольку может рекомендовать в пять раз больше подходящих товаров по сравнению со стартовым набором, которому ее обучили.
В других экспериментах Headless-AD тоже доказала способность выполнять любые комбинации и число действий без снижения качества и дополнительного обучения. Модель и результаты испытаний подробно описали в статье In-Context Reinforcement Learning for Variable Action Spaces. Исходный код и дополнительные материалы доступны на сайте GitHub.
Российскую разработку представили на международной конференции по машинному обучению ICML (International Conference on Machine Learning), одной из самых престижных и крупных в этой сфере. В 2024 году мероприятие проходит в Австрии с 21 по 27 июля.
О T-Bank AI Research
Лаборатория T-Bank Al Research, входящая в состав Центра искусственного интеллекта Т-Банка, исследует наиболее перспективные направления в области искусственного интеллекта. Среди них — обработка естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys).
Статьи исследователей участвуют в авторитетных научных конференциях, таких как NeurIPS, ICML, ACL, CVPR и других. Выдержки из них в своих публикациях цитируют ученые из университетов Беркли и Стэнфорда, а также участники исследовательского проекта Google DeepMind.
Команда помогает и молодым талантам, курируя исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете.
Сам факт того, что после распада Западной Римской империи возникали новые государства, историкам известен давно. Нет сомнений в существовании королевств готов, франков, лангобардов и других постримских политических образований. Авторы нового исследования сосредоточились на более сложном вопросе. Они попытались выяснить, как именно происходило формирование таких обществ на уровне отдельных людей, семей и общин. Впервые благодаря сочетанию генетических и археологических данных исследователи смогли реконструировать развитие одного постримского политического общества, которое располагалось на территории Паннонии.
Физикам долго не удавалось применить фазовый контраст в электронной микроскопии. Оказалось, что нужно было прекратить искать подходящее вещество для фазовой пластины и обратить внимание на лазеры.
Ученые впервые объединили головной мозг и аналог спинного мозга плодовой мушки в общую трехмерную карту. Результаты показали, как голова и тело обмениваются сигналами. Анализ сети помог выявить распределенную систему контроля: базовыми движениями насекомого руководили местные группы нейронов, тогда как мозг играл лишь роль координатора.
Сам факт того, что после распада Западной Римской империи возникали новые государства, историкам известен давно. Нет сомнений в существовании королевств готов, франков, лангобардов и других постримских политических образований. Авторы нового исследования сосредоточились на более сложном вопросе. Они попытались выяснить, как именно происходило формирование таких обществ на уровне отдельных людей, семей и общин. Впервые благодаря сочетанию генетических и археологических данных исследователи смогли реконструировать развитие одного постримского политического общества, которое располагалось на территории Паннонии.
Физикам долго не удавалось применить фазовый контраст в электронной микроскопии. Оказалось, что нужно было прекратить искать подходящее вещество для фазовой пластины и обратить внимание на лазеры.
Ученые с высокой точностью измерили ключевые параметры нейтринных осцилляций — угол смешивания θ₁₂ и разность квадратов масс нейтрино. Результаты верифицировали несколькими методами.
Хотя длительность помех не превышала десяти секунд, это первый известный случай такого рода. Обычно спутникам не хватает мощности для создания радиосигналов той силы, что нужна для подобных помех.
В высокогорных районах Гималаев появился новый хищник. Он не боится людей, возглавляет стаи собак и все чаще заходит в деревни. Местные жители называют его «кхипшанг». Речь идет о гибриде гималайского волка и бродячей собаки. Ученые опасаются, что этот зверь изменит хрупкий баланс местной дикой природы и в скором времени станет весьма опасным для человека.
В доколумбовых Андах принадлежность к правящему роду определяла доступ к земле, торговле и статусу, поэтому удержать все внутри семьи было вопросом выживания. Ученые выяснили, что элиты долины Чинча решали эту задачу самым прямым способом — заключая браки между родственниками на протяжении как минимум двух поколений.
Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.
Понятно
Что-то в вашем комментарии показалось подозрительным, поэтому перед публикацией он пройдет модерацию.
Понятно
Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.
Понятно
Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.
Понятно
Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.
Понятно
Последние комментарии