04.08.2023, 15:34

Мария Азарова

12,5 тыс

Ученые из Tinkoff Research создали алгоритм, повышающий скорость обучения ИИ в 20 раз

❋ 5.8

Специалисты лаборатории исследований искусственного интеллекта Tinkoff Research — одна из немногих исследовательских групп, которая проводит научные исследования внутри компании, а не на базе некоммерческой организации — сообщили об открытии нового алгоритма, обучающего ИИ в 20 раз быстрее. Результаты представили на 40-й Международной конференции по машинному обучению (ICML), прошедшей в конце июля на Гавайских островах.

Медиа

# Tinkoff Research

# ИИ

# обучение с подкреплением

Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Четыре рисунка сверху — предыдущие методы, основанные на RND, четыре рисунка снизу — метод SAC-RND. Стрелки на изображении должны вести робота в одну точку — они указывают направление к правильному действию. Метод Tinkoff Research во всех случаях стабильно приводит робота в нужную точку / © Tinkoff Research / Автор: Анастасия Кожевникова

Новый метод назвали SAC-RND — Soft Actor Critic (мягкий актор-критик), RND — Random Network Distillation (случайные нейронные сети). Как показали испытания на робототехнических симуляторах, SAC-RND от Tinkoff Research в 20 раз быстрее и на 10 процентов качественнее достигает результатов при меньшем количестве потребляемых ресурсов и времени.

В методе RND задействованы случайная и основная нейросети, при этом вторая пытается предсказать поведение первой. Важна глубина нейросети, то есть количество слоев, из которых она состоит. У основной их не должно быть меньше, чем у случайной, в противном случае она не сможет смоделировать ее поведение. Это повлечет нестабильность либо станет причиной невозможности обучения.

Ученые из Tinkoff Research выяснили, что у авторов предыдущих исследований, посвященных теме использования случайных нейросетей в обучении с подкреплением (Reinforcement learning, RL), размер случайной сети составлял четыре слоя, в то время как у основной их было два. Таким образом удалось выявить недостатки в более ранних экспериментах и выводах, из-за которых считалось, что метод RND не способен классифицировать данные — отличать действия в датасете от тех, что там не было. Специалисты Tinkoff Research исправили глубины сетей, превратив их в эквивалентные, и обнаружили, что в таком случае метод может различать данные.

Затем ученые взялись за оптимизацию метода: в итоге, за счет механизма слияния, в основе которого — модуляция сигналов и их линейное отображение, — роботы научились приходить к эффективным решениям. В предыдущих исследованиях на тему RND сигналы дополнительно не обрабатывали.

Благодаря SAC-RND появится возможность повысить уровень безопасности беспилотных автомобилей, облегчить логистические цепочки, сделать быстрее доставку и работу на складах. Помимо этого, с помощью нового метода можно будет оптимизировать процессы горения на энергетических объектах и сократить выбросы вредных веществ.

«Обучение искусственного интеллекта — процесс, требующий больших ресурсов: прежде всего вычислительных мощностей, финансовых затрат и времени. Его оптимизация позволит ускорить развитие всех областей, в которых используются ИИ-агенты, например робототехники».
Пресс-служба «Тинькофф»

Более того, разработка ученых из Tinkoff Research позволит не только сделать лучше работу узкоспециализированных роботов, ускорить исследования, в том числе в области обучения с подкреплением, но и приблизит создание универсального робота, который будет справляться с различными задачами в одиночку.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Медиа

# Tinkoff Research

# ИИ

# обучение с подкреплением

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Когда природа повторяет себя: удивительные двойники эволюции

Центр «Архэ»

Онлайн

Лекция

16 Дек

Бесплатно

Битва за Ржев и взятие Ржева

Российская государственная библиотека

Москва

Лекция

16 Дек

Бесплатно

Как сохранить и представить исторические источники?

Библиотека иностранной литературы

Москва

Центр «Архэ»

Москва

Лекция

16 Дек

750 ₽

Особенности русской средневековой культуры

Центр «Архэ»

Онлайн

Курилка Гутенберга

Москва

Лекция

18 Дек

Бесплатно

Медицинские нейротехнологии

Нейрокампус

Москва

Лекция

18 Дек

1200 ₽

В космос по цене авиабилета

Центр «Архэ»

Москва

Лекция

18 Дек

Бесплатно

Андрэ Дави — исследователь Нила

Библиотека иностранной литературы

Москва

Популярное

За сутки

За неделю

За месяц

12 декабря, 10:30

Редакция Naked Science

Инфографика: сравнение российского термоядерного реактора с ИТЭР

Во Франции достраивают международный термоядерный реактор ИТЭР, в проекте которого Россия выступила и инициатором, и поставщиком ключевых компонентов: например, таких, как сверхпроводники, позволяющие магнитам токамака удерживать плазму при температуре до полутора сотен миллионов градусов. Но одновременно с этим проектом в нашей стране работают над национальным проектом токамака с реакторными технологиями (ТРТ), строительство которого начинается во второй половине 2020-х годов. Что будет отличать его от ИТЭР и других реакторов-предшественников — в инфографике Naked Science.

Технологии

# инфографика

# ИТЭР

# термоядерный реактор

Выбор редакции

12 декабря, 16:32

Максим Абдулаев

Недосып занял второе место после курения в рейтинге факторов, сокращающих жизнь

Исследователи из Орегонского университета здоровья и науки установили, что хронический недостаток сна снижает среднюю продолжительность жизни населения сильнее, чем безработица или отсутствие медицинской страховки. Масштабный анализ данных по всем округам США показал: недосып — второй по значимости поведенческий фактор риска ранней смерти, он уступает лидерство только курению.

Медицина

# бессонница

# курение

# недосып

12 декабря, 17:06

Редакция Naked Science

Археологи обнаружили уникальную для Малой Азии раннехристианскую фреску времен греческого культурного влияния

Турецкие археологи обнаружили раннехристианскую фреску с изображением «Доброго Пастыря Иисуса». Этот мотив крайне редко встречается в Анатолии. Возможно, найденная фреска — единственная работа такого типа во всем регионе.

Археология

# гробница

# история

# ранние христиане

# Римская империя

# Турция

# фрески

8 декабря, 13:38

Александр Березин

Как Россия разрабатывает материалы для реакторов нового поколения — от земных АЭС до космических систем. Интервью с Алексеем Дубом

Новые материалы позволяют построить атомные реакторы и для полетов в космос, и для получения зеленой и более дешевой электроэнергии на Земле. Технологии, лежащие в основе их создания, помогают даже выращивать биологические ткани для замены поврежденных. Мы поговорили обо всем этом с научным руководителем направления «Материалы и технологии» Госкорпорации «Росатом», первым заместителем директора частного учреждения «Наука и инновации» Алексеем Дубом.

Интервью

# атомная энергетика

# АЭС

# здоровье

# космос

# материалы

# медицина

# новые материалы

# Россия

# технологии

Выбор редакции

8 декабря, 10:39

Илья Гриднев

Физики воссоздали мысленный эксперимент Эйнштейна и подтвердили правоту Бора

Ученые впервые на практике реализовали знаменитый мысленный эксперимент с «подвижной щелью», который обсуждали Бор и Эйнштейн почти 100 лет назад. Опыт с отдельным атомом показал, что попытка отследить путь частицы неизбежно разрушает ее волновые свойства.

Физика

# Альберт Эйнштейн

# квантовая механика

# Нильс Бор

10 декабря, 13:58

Андрей Серегин

Человек по уровню моногамии оказался ближе к сурикатам, чем к шимпанзе

Является ли моногамия естественным состоянием для человека? Новое исследование, основанное на анализе почти 200 тысяч родословных млекопитающих, подтвердило это суждение, поместив Homo sapiens в один эволюционный ряд с сурикатами и гиббонами.

Биология

# животные

# моногамия

# размножение

# родственники

# человек

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

29 ноября, 12:42

Александр Березин

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

Космонавтика

# «Союз МС»

# Байконур

# корабль Союз

# космодром «Восточный»

# космодром Байконур

# космос

# Роскосмос

# Россия

Выбор редакции

27 ноября, 20:20

Максим Абдулаев

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

Археология

# алкоголь

# античность

# вино

# виноделие

# дрожжи

# история

# микробиология

[miniorange_social_login]

ИИ это не только языковые программы, конечно, и будущее у него есть. Но проблема в нюансах. Любой современный ИИ - это попытки оптимизации алгоритма "китайской комнаты" разными методами. Но ожиданий от ИИ - просто как от радиации в XIX веке. Переворота в познании ИИ не принесёт, это что-то вроде "логического усилителя", про который Лем писал в "Сумме технологии". Позволит людям эффективнее думать, но вот думать за людей он пока не может, да и не должен. А те, кто продвигает обратное - либо идеалисты, либо просто дураки.

Ответить

ещё комментарии

Rusya Alphacino

06.08.2023

Мы дураки, а вы предпочитаете обнадеживать себя идеей, что вы вершина творения (эволюции)? Как-то наивно предполагать, что небольшой биологический код, предположительно умещающийся на CD диск, записанный в сперматозоиде и яйцеклетке при пощении в, пардон, инкубатор может самообучиться до осознания себя, а машинный код, появившийся на свет меньше столетия назад, на такое не способен. А ведь по большому счету мы сами и сидим в этой китайской комнате, не осознавая почему мы делаем то, что делаем, ковыряемся в этих непонятных мирозданских иероглифах. Попросту так же движимые самообучающимся алгоритмом.

Ответить

ראובן פיאטיגורסקי

04.08.2023

Комментарий удален пользователем или модератором...

Ответить

—

Вася Васин

04.08.2023

Ответить

ещё комментарии

Rusya Alphacino

06.08.2023

Ответить

sergey qwerty

07.08.2023

тоже мне изобретатели😁 sac-rnd давно существует в топовых фрейворках по rl , на гит полно примеров реализации

Ответить

Ученые из Tinkoff Research создали алгоритм, повышающий скорость обучения ИИ в 20 раз

По теме

В Пермском Политехе научили искусственный интеллект поиску новых сотрудников

ИИ помог выявлять болезнь Паркинсона на ранних стадиях по снимкам глазного дна

В MIT создана «Машина кошмаров»

Популярное

Комментарии

Последние новости:

В прошлом у Марса могла быть большая луна, которая управляла приливами

Астрофизики объяснили обратное вращение Венеры

Легкие атомные ядра оказались избавлены от воздействия экстремально высоких температур в БАК

Археологи обнаружили уникальную для Малой Азии раннехристианскую фреску времен греческого культурного влияния

Инфографика: сравнение российского термоядерного реактора с ИТЭР

Советское наступление под Москвой: почему Красная армия победила, несмотря на немецкое превосходство

Как Россия разрабатывает материалы для реакторов нового поколения — от земных АЭС до космических систем. Интервью с Алексеем Дубом

Какой ядерный реактор строить: тест ваших предпочтений

Последние комментарии

Самые обсуждаемые

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

«Аффект зомби»: философ описал новое психоэмоциональное состояние современного человека

Инфографика: сравнение российского термоядерного реактора с ИТЭР

Антропологи развеяли миф о «благородных дикарях»