04.08.2023, 15:34

Мария Азарова

12,5 тыс

Ученые из Tinkoff Research создали алгоритм, повышающий скорость обучения ИИ в 20 раз

❋ 5.8

Специалисты лаборатории исследований искусственного интеллекта Tinkoff Research — одна из немногих исследовательских групп, которая проводит научные исследования внутри компании, а не на базе некоммерческой организации — сообщили об открытии нового алгоритма, обучающего ИИ в 20 раз быстрее. Результаты представили на 40-й Международной конференции по машинному обучению (ICML), прошедшей в конце июля на Гавайских островах.

Медиа

# Tinkoff Research

# ИИ

# обучение с подкреплением

Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Четыре рисунка сверху — предыдущие методы, основанные на RND, четыре рисунка снизу — метод SAC-RND. Стрелки на изображении должны вести робота в одну точку — они указывают направление к правильному действию. Метод Tinkoff Research во всех случаях стабильно приводит робота в нужную точку / © Tinkoff Research / Автор: Анастасия Кожевникова

Новый метод назвали SAC-RND — Soft Actor Critic (мягкий актор-критик), RND — Random Network Distillation (случайные нейронные сети). Как показали испытания на робототехнических симуляторах, SAC-RND от Tinkoff Research в 20 раз быстрее и на 10 процентов качественнее достигает результатов при меньшем количестве потребляемых ресурсов и времени.

В методе RND задействованы случайная и основная нейросети, при этом вторая пытается предсказать поведение первой. Важна глубина нейросети, то есть количество слоев, из которых она состоит. У основной их не должно быть меньше, чем у случайной, в противном случае она не сможет смоделировать ее поведение. Это повлечет нестабильность либо станет причиной невозможности обучения.

Ученые из Tinkoff Research выяснили, что у авторов предыдущих исследований, посвященных теме использования случайных нейросетей в обучении с подкреплением (Reinforcement learning, RL), размер случайной сети составлял четыре слоя, в то время как у основной их было два. Таким образом удалось выявить недостатки в более ранних экспериментах и выводах, из-за которых считалось, что метод RND не способен классифицировать данные — отличать действия в датасете от тех, что там не было. Специалисты Tinkoff Research исправили глубины сетей, превратив их в эквивалентные, и обнаружили, что в таком случае метод может различать данные.

Затем ученые взялись за оптимизацию метода: в итоге, за счет механизма слияния, в основе которого — модуляция сигналов и их линейное отображение, — роботы научились приходить к эффективным решениям. В предыдущих исследованиях на тему RND сигналы дополнительно не обрабатывали.

Благодаря SAC-RND появится возможность повысить уровень безопасности беспилотных автомобилей, облегчить логистические цепочки, сделать быстрее доставку и работу на складах. Помимо этого, с помощью нового метода можно будет оптимизировать процессы горения на энергетических объектах и сократить выбросы вредных веществ.

«Обучение искусственного интеллекта — процесс, требующий больших ресурсов: прежде всего вычислительных мощностей, финансовых затрат и времени. Его оптимизация позволит ускорить развитие всех областей, в которых используются ИИ-агенты, например робототехники».
Пресс-служба «Тинькофф»

Более того, разработка ученых из Tinkoff Research позволит не только сделать лучше работу узкоспециализированных роботов, ускорить исследования, в том числе в области обучения с подкреплением, но и приблизит создание универсального робота, который будет справляться с различными задачами в одиночку.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Медиа

# Tinkoff Research

# ИИ

# обучение с подкреплением

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Удивительные женщины Арабского Востока

Российская государственная библиотека

Москва

Лекция

24 Июн

Бесплатно

Как идеи превращаются в реальное изменение системы

Университет ИТМО

Онлайн

Лекция

24 Июн

Бесплатно

Как русские цари себе жен выбирали

Библиотека роста и карьеры

Санкт-Петербург

Лекция

24 Июн

Бесплатно

Все пилотируемые полеты с рекордным удалением от Земли

Москва

Миры, которые мы не видим: история поиска экзопланет

Московский Планетарий

Москва

Лекция

25 Июн

Бесплатно

От канарейки в доме до ястреба в аэропорту

Московский зоопарк

Москва

Лекция

25 Июн

Бесплатно

Как мозг обманывает. Природа ошибок мышления

Библиотека им. М.А. Светлова

Москва

Лекция

26 Июн

Бесплатно

Амир Тимур и его империя

Российская государственная библиотека

Москва

Лекция

26 Июн

600 ₽

Урарту: между историей, археологией и экспериментом

Центр «Архэ»

Онлайн

ИИ это не только языковые программы, конечно, и будущее у него есть. Но проблема в нюансах. Любой современный ИИ - это попытки оптимизации алгоритма "китайской комнаты" разными методами. Но ожиданий от ИИ - просто как от радиации в XIX веке. Переворота в познании ИИ не принесёт, это что-то вроде "логического усилителя", про который Лем писал в "Сумме технологии". Позволит людям эффективнее думать, но вот думать за людей он пока не может, да и не должен. А те, кто продвигает обратное - либо идеалисты, либо просто дураки.

Ответить

ещё комментарии

Rusya Alphacino

06.08.2023

Мы дураки, а вы предпочитаете обнадеживать себя идеей, что вы вершина творения (эволюции)? Как-то наивно предполагать, что небольшой биологический код, предположительно умещающийся на CD диск, записанный в сперматозоиде и яйцеклетке при пощении в, пардон, инкубатор может самообучиться до осознания себя, а машинный код, появившийся на свет меньше столетия назад, на такое не способен. А ведь по большому счету мы сами и сидим в этой китайской комнате, не осознавая почему мы делаем то, что делаем, ковыряемся в этих непонятных мирозданских иероглифах. Попросту так же движимые самообучающимся алгоритмом.

Ответить

ראובן פיאטיגורסקי

04.08.2023

Комментарий удален пользователем или модератором...

Ответить

—

Вася Васин

04.08.2023

Ответить

ещё комментарии

Rusya Alphacino

06.08.2023

Ответить

sergey qwerty

07.08.2023

тоже мне изобретатели😁 sac-rnd давно существует в топовых фрейворках по rl , на гит полно примеров реализации

Ответить

Ученые из Tinkoff Research создали алгоритм, повышающий скорость обучения ИИ в 20 раз

По теме

В Пермском Политехе научили искусственный интеллект поиску новых сотрудников

ИИ помог выявлять болезнь Паркинсона на ранних стадиях по снимкам глазного дна

В MIT создана «Машина кошмаров»

Популярное

Комментарии

Последние новости:

Прыгающий ген впервые поймали за «переездом» между видами

Археогенетики нашли в Тоскане сорт белого винограда, который этруски и римляне выращивали 300 лет подряд

Ультразвук позволил улучшить качество нефти прямо на месторождении

Физики нашли «невидимую» для атома тулия длину волны

Невозможное возможно: как вакуумный двигатель SpaceX RaptorVAC работает при атмосферном давлении

Жанна д’Арк: как неграмотная девушка определила будущее мира

Они прилетели из чужих миров: как Оумуамуа, комета Борисова и 3I/ATLAS изменили астрономию

Татуированные кочевники: как в России спасают редких соколов-бало́банов

Последние комментарии

Самые обсуждаемые

Большая часть даже Солнечной системы оказалась не проверена на техносигнатуры

Астрофизик пересмотрел ограничения на число разумных цивилизаций во Вселенной

«Роскосмос» прекратит использовать часть модуля МКС из-за утечки воздуха, сообщили источники в NASA

Земля в прошлом могла «заразить» жизнью подледный океан Европы