В прошлом ИИ-системы выполняли определенный набор задач, а при появлении новых их нужно было переобучать. На это уходили дополнительные финансовые и вычислительные ресурсы. Открытие лаборатории исследований искусственного интеллекта T-Bank AI Research и Института AIRI меняет ситуацию. Ученые первыми в мире создали модель в области контекстного обучения (In-Context Learning), которая на нескольких примерах сама может учиться новым действиям.
Модель, названная Headless-AD, способна выполнять в пять раз больше действий, чем в нее заложено при начальном обучении. Такого рода ИИ-системы, умеющие адаптироваться к изменениям среды и новым задачам без вмешательства людей, будут полезны во многих областях — от бытовых до связанных с космической отраслью.
В частности, подобные системы могут найти применение в домашних роботах-помощниках. Предварительно их можно будет обучать стандартному набору действий в доме. В дальнейшем, за счет заложенных в Headless-AD возможностей к самообучению, домашние роботы смогут подстраиваться под персональные нужды домохозяйств.
Еще один возможный сценарий — внедрение Headless-AD в беспилотных автомобилях. ИИ-модель позволит им адаптироваться к замене деталей на новые, причем даже с другим принципом работы. Пример — установка более мощного двигателя или нового типа шин.
Исследователи провели серию экспериментов, в которых сравнили Headless-AD с ближайшими аналогами. Одна из протестированных задач — составление рекомендаций к товарам. Другие модели требуют переобучения для новых групп товаров, а при увеличении их количества теряют в качестве. Headless-AD показала преимущество, поскольку может рекомендовать в пять раз больше подходящих товаров по сравнению со стартовым набором, которому ее обучили.
В других экспериментах Headless-AD тоже доказала способность выполнять любые комбинации и число действий без снижения качества и дополнительного обучения. Модель и результаты испытаний подробно описали в статье In-Context Reinforcement Learning for Variable Action Spaces. Исходный код и дополнительные материалы доступны на сайте GitHub.
Российскую разработку представили на международной конференции по машинному обучению ICML (International Conference on Machine Learning), одной из самых престижных и крупных в этой сфере. В 2024 году мероприятие проходит в Австрии с 21 по 27 июля.
Лаборатория T-Bank Al Research, входящая в состав Центра искусственного интеллекта Т-Банка, исследует наиболее перспективные направления в области искусственного интеллекта. Среди них — обработка естественного языка (NLP), компьютерное зрение (CV) и рекомендательные системы (RecSys).
Статьи исследователей участвуют в авторитетных научных конференциях, таких как NeurIPS, ICML, ACL, CVPR и других. Выдержки из них в своих публикациях цитируют ученые из университетов Беркли и Стэнфорда, а также участники исследовательского проекта Google DeepMind.
Команда помогает и молодым талантам, курируя исследовательские лаборатории T-Bank Lab в МФТИ и Omut AI в Центральном университете.