04.08.2023

Мария Азарова

Ученые из Tinkoff Research создали алгоритм, повышающий скорость обучения ИИ в 20 раз

5.8

Специалисты лаборатории исследований искусственного интеллекта Tinkoff Research — одна из немногих исследовательских групп, которая проводит научные исследования внутри компании, а не на базе некоммерческой организации — сообщили об открытии нового алгоритма, обучающего ИИ в 20 раз быстрее. Результаты представили на 40-й Международной конференции по машинному обучению (ICML), прошедшей в конце июля на Гавайских островах.

Медиа

# Tinkoff Research

# ИИ

# обучение с подкреплением

Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Четыре рисунка сверху — предыдущие методы, основанные на RND, четыре рисунка снизу — метод SAC-RND. Стрелки на изображении должны вести робота в одну точку — они указывают направление к правильному действию. Метод Tinkoff Research во всех случаях стабильно приводит робота в нужную точку / © Tinkoff Research / Автор: Анастасия Кожевникова

Новый метод назвали SAC-RND — Soft Actor Critic (мягкий актор-критик), RND — Random Network Distillation (случайные нейронные сети). Как показали испытания на робототехнических симуляторах, SAC-RND от Tinkoff Research в 20 раз быстрее и на 10 процентов качественнее достигает результатов при меньшем количестве потребляемых ресурсов и времени.

В методе RND задействованы случайная и основная нейросети, при этом вторая пытается предсказать поведение первой. Важна глубина нейросети, то есть количество слоев, из которых она состоит. У основной их не должно быть меньше, чем у случайной, в противном случае она не сможет смоделировать ее поведение. Это повлечет нестабильность либо станет причиной невозможности обучения.

Ученые из Tinkoff Research выяснили, что у авторов предыдущих исследований, посвященных теме использования случайных нейросетей в обучении с подкреплением (Reinforcement learning, RL), размер случайной сети составлял четыре слоя, в то время как у основной их было два. Таким образом удалось выявить недостатки в более ранних экспериментах и выводах, из-за которых считалось, что метод RND не способен классифицировать данные — отличать действия в датасете от тех, что там не было. Специалисты Tinkoff Research исправили глубины сетей, превратив их в эквивалентные, и обнаружили, что в таком случае метод может различать данные.

Затем ученые взялись за оптимизацию метода: в итоге, за счет механизма слияния, в основе которого — модуляция сигналов и их линейное отображение, — роботы научились приходить к эффективным решениям. В предыдущих исследованиях на тему RND сигналы дополнительно не обрабатывали.

Благодаря SAC-RND появится возможность повысить уровень безопасности беспилотных автомобилей, облегчить логистические цепочки, сделать быстрее доставку и работу на складах. Помимо этого, с помощью нового метода можно будет оптимизировать процессы горения на энергетических объектах и сократить выбросы вредных веществ.

«Обучение искусственного интеллекта — процесс, требующий больших ресурсов: прежде всего вычислительных мощностей, финансовых затрат и времени. Его оптимизация позволит ускорить развитие всех областей, в которых используются ИИ-агенты, например робототехники».
Пресс-служба «Тинькофф»

Более того, разработка ученых из Tinkoff Research позволит не только сделать лучше работу узкоспециализированных роботов, ускорить исследования, в том числе в области обучения с подкреплением, но и приблизит создание универсального робота, который будет справляться с различными задачами в одиночку.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Медиа

# Tinkoff Research

# ИИ

# обучение с подкреплением

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Российская государственная библиотека

Москва

Лекция

03 Июл

Бесплатно

Болезнь Альцгеймера: новая парадигма диагностики и терапии

Парк «Зарядье»

Москва

Лекция

03 Июл

Бесплатно

Растения большого города

Центр «Архэ»

Москва

Лекция

03 Июл

Бесплатно

Применение ИИ в разработке лекарств

Библиотека Планетарий 1

Санкт-Петербург

Лекция

03 Июл

1300 ₽

Как астрономы помогают физикам

Живое слово

Тверь

Курилка Гутенберга

Москва

Лекция

03 Июл

Бесплатно

Исторические цивилизации на Северном Тянь-Шане

Русское географическое общество

Москва

Лекция

04 Июл

Бесплатно

Гипотезы о происхождении языка

ВДНХ

Москва

Лекция

05 Июл

Бесплатно

Диагноз по картине: болезни художников, повлиявшие на их творчество

ВДНХ

Москва

Популярное

За сутки

За неделю

За месяц

4 часа назад

Юлия Тарасова

Коров покормили отходами конопли и проверили их молоко на психоактивность

Результаты эксперимента в США в будущем могут позволить добиться разрешения на использование отработанной конопли в качестве кормовой добавки в животноводстве.

Биология

# животноводство

# конопля

# корм

# коровы

# молоко

# ТГК

# тетрагидроканнабинол

7 часов назад

Адель Романова

Геологи объяснили «пульсацию» под земной корой в Африке

На стыке трех литосферных плит у Красного моря заметили необычный вулканический процесс: где-то магма поднимается равномерным потоком, где-то — по частям. По мнению геологов, такой «пульс» вызван тем, что в некоторых местах магма с большим трудом пытается пробиться на поверхность.

Геология

# Восточная Африка

# движение тектонических плит

# земная кора

# литосферные плиты

# мантийные плюмы

4 часа назад

Игорь Байдов

«‎Неандертальский череп» стал причиной головной боли у некоторых современных людей

Форма черепа у людей, которым поставили диагноз «мальформация Арнольда — Киари I типа», отчасти напоминает строение головы неандертальцев. Это выяснила международная команда антропологов. Они провели сравнительный анализ черепов видов Homo и пришли к выводу, что именно это сходство может объяснить, почему часть людей мучается от постоянной головной боли и других неврологических проблем.

Антропология

# Homo

# Homo sapiens

# гены

# головная боль

# неандертальцы

# патологии

# сапиенсы

# черепа

25 июня

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Группа российских ученых из Института прикладной математики имени М. В. Келдыша РАН и МФТИ провела детальное численное исследование источников шума, генерируемых крылом прототипа сверхзвукового бизнес-джета в режиме посадки. Эта работа, сочетающая передовые методы вычислительной гидродинамики и аэроакустики, впервые позволила с высокой точностью локализовать и охарактеризовать основные зоны шумообразования вблизи полноразмерной геометрии крыла модели прототипа сверхзвукового пассажирского самолета в посадочной конфигурации.

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

25 июня

Елена Авдеева

Ученые узнали, почему акулы замирают, когда их переворачивают кверху брюхом

Состояние паралича, в которое впадают разные виды животных, хорошо известно и задокументировано. Обычно оно считается защитной реакцией в случае опасности, но никаких доказательств этому до сих пор нет. Особенно загадочным остается поведение обитателей океана, притворяющихся мертвыми. Ученые проверили существующие объяснения этого эффекта и сделали неожиданные выводы.

Биология

# акулы

# паралич

# симуляция

# хрящевые рыбы

# эволюция

28 июня

Игорь Байдов

Человек сделал балтийскую треску «карликом»

За последние 30 лет размер трески, обитающей в Балтийском море, значительно уменьшился. Если раньше рыбаки вылавливали из воды особей размером с маленького ребенка, то теперь добытая рыба легко помещается в ладонях. Авторы нового исследования винят в этом человека, который заставил один из видов эволюционировать в «карликов».

Биология

# Балтийское море

# Балтика

# виды

# промысел рыбы

# Рыба

# треска

# эволюция

17 июня

Адель Романова

Давно отключенный спутник внезапно прислал «громкий» радиосигнал

Радиотелескопы уловили очень короткий сигнал, и по его характеристикам стало ясно, что он не может быть естественного происхождения. Астрономы пришли к выводу, что источник находился в околоземном пространстве — там, где уже более полувека летает «мертвый» аппарат NASA.

Астрономия

# космический мусор

# космос

# радиосигналы

# спутники

25 июня

ФизТех

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

ФизТех

# «Суперджет»

# самолет

# сверхзвуковой

# суперкомпьютеры

# Шум

5 июня

Александр Березин

Нашествие миллиона антилоп на Россию заставило фермеров просить об отстреле с вертолетов

Вид антилоп, с ледникового периода привыкший к массовым миграциям, пытается вернуться в свой исторический ареал, когда-то достигавший Днепра. Однако их нетипичные для травоядных привычки вызывают сильнейшее отторжение у сельских жителей, предлагающих массово уничтожать их с воздуха. С экологической точки зрения возвращение этих животных весьма желательно, но как примирить их с фермерами — неясно.

Биология

# антилопы

# глобальное озеленение

# Россия

[miniorange_social_login]

ИИ это не только языковые программы, конечно, и будущее у него есть. Но проблема в нюансах. Любой современный ИИ - это попытки оптимизации алгоритма "китайской комнаты" разными методами. Но ожиданий от ИИ - просто как от радиации в XIX веке. Переворота в познании ИИ не принесёт, это что-то вроде "логического усилителя", про который Лем писал в "Сумме технологии". Позволит людям эффективнее думать, но вот думать за людей он пока не может, да и не должен. А те, кто продвигает обратное - либо идеалисты, либо просто дураки.

Ответить

ещё комментарии

Rusya Alphacino

06.08.2023

Мы дураки, а вы предпочитаете обнадеживать себя идеей, что вы вершина творения (эволюции)? Как-то наивно предполагать, что небольшой биологический код, предположительно умещающийся на CD диск, записанный в сперматозоиде и яйцеклетке при пощении в, пардон, инкубатор может самообучиться до осознания себя, а машинный код, появившийся на свет меньше столетия назад, на такое не способен. А ведь по большому счету мы сами и сидим в этой китайской комнате, не осознавая почему мы делаем то, что делаем, ковыряемся в этих непонятных мирозданских иероглифах. Попросту так же движимые самообучающимся алгоритмом.

Ответить

ראובן פיאטיגורסקי

04.08.2023

Комментарий удален пользователем или модератором...

Ответить

—

Вася Васин

04.08.2023

Ответить

ещё комментарии

Rusya Alphacino

06.08.2023

Ответить

sergey qwerty

07.08.2023

тоже мне изобретатели😁 sac-rnd давно существует в топовых фрейворках по rl , на гит полно примеров реализации

Ответить

Ученые из Tinkoff Research создали алгоритм, повышающий скорость обучения ИИ в 20 раз

По теме

В Пермском Политехе научили искусственный интеллект поиску новых сотрудников

ИИ помог выявлять болезнь Паркинсона на ранних стадиях по снимкам глазного дна

В MIT создана «Машина кошмаров»

Популярное

Комментарии

Последние новости:

Ученые придумали, как быстрее выращивать полезные бактерии для кормов

Российские врачи измерили температуру органов без скальпеля и МРТ

Астрономы впервые запечатлели сверхновую, которая «взорвалась» дважды

Нейросеть научили точно распознавать объекты по тепловым снимкам

Полет фантазии: заменит ли орбитальное базирование боеголовок современные МБР?

«Отвратительная тайна эволюции»: что стало известно о самом древнем цветке

Иран и Израиль — дойдет ли дело до ядерного оружия?

Трамп и Маск разругались: сорвет ли это высадку на Луну и как отразится на России?

Последние комментарии

Самые обсуждаемые

Российские ученые впервые точно определили источники шума сверхзвукового самолета с помощью суперкомпьютера

Астрономы впервые подсчитали количество пригодных для жизни экзопланет с помощью статистического метода

Лишайники с «загаром» указали на потенциальную обитаемость планет вокруг самых массовых звезд Вселенной

Бумеранг из Облазовой пещеры оказался одним из древнейших в Европе и, возможно, в мире