• Добавить в закладки
  • Facebook
  • Twitter
  • Telegram
  • VK
  • Печать
  • Email
  • Скопировать ссылку
28.06.2023
НИУ ВШЭ
1 218

Новое решение российских ученых позволит машинному обучению работать в десятки раз быстрее

4.8

Исследователи факультета компьютерных наук ВШЭ и Лаборатории искусственного интеллекта Сбера смогли увеличить скорость работы градиентного бустинга — одного из самых эффективных алгоритмов для решения задач машинного обучения. Предложенный подход позволит быстрее решать задачи классификации и регрессии машинного обучения.

Новое решение российских ученых позволит машинному обучению работать в десятки раз быстрее
Новое решение российских ученых позволит машинному обучению работать в десятки раз быстрее / ©Getty images / Автор: Анастасия Кожевникова

Результаты их работы были представлены на конференции NeurIPS. Большинство задач в области анализа данных сводятся к прогнозированию на основе имеющихся данных. Это может быть задача классификации, когда нужно определить принадлежность объекта к определенному классу, или регрессии, когда нужно предсказать числовое значение. В практической работе часто возникают ситуации, где количество классов или размерность регрессии может быть очень большой.

В таких ситуациях исследователи прибегают к градиентному бустингу — продвинутому алгоритму машинного обучения, который решает задачи классификации и регрессии. Он строит предсказание в виде ансамбля слабых моделей. Из нескольких слабых моделей в итоге получается одна, но эффективная.

«Работа алгоритма градиентного бустинга похожа на гольф: чтобы загнать мяч в лунĸу, гольфист ударяет клюшкой по мячу, каждый раз исходя из предыдущего удара. Перед новым ударом гольфист смотрит на расстояние между мячом и лунĸой и стремится его сократить. Бустинг строится примерно так же: каждая новая модель стремится сократить ошибку уже построенного ансамбля моделей», — поясняет один из авторов доклада, эксперт Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Леонид Иосипой.

У градиентного бустинга есть проблема — в классификации с очень большим количеством классов может потребоваться практически бесконечное время на обучение модели.

Решая задачу классификации, алгоритм не просто определяет классы, которые соответствуют каждому объекту, он определяет вероятность принадлежности каждого объекта к каждому возможному классу. Таким образом, чем больше классов, на которые делятся объекты, тем больше результатов выдает алгоритм. Как следствие, растет вычислительная сложность этого алгоритма.

«Наши исследователи разработали уникальный фреймворк, который позволяет расширить границы применимости градиентного бустинга. Новый алгоритм способен показывать лучшие результаты в целом ряде задач, где ранее применялись только нейросетевые подходы. Предложенный подход строится на сжимании данных перед самым времязатратным этапом — поиском оптимальной структуры дерева. Это решение откроет новые возможности для исследования моделей в области машинного обучения с целью совершенствования технологий с использованием искусственного интеллекта», — считает директор Лаборатории искусственного интеллекта Сбера Глеб Гусев. 

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.
Национальный исследовательский университет «Высшая школа экономики» — один из крупнейших и самых востребованных вузов России. В университете учится 54 тысячи студентов и работает почти 4,5 тысячи учёных и преподавателей. НИУ ВШЭ ведёт фундаментальные и прикладные исследования в области социально-экономических, гуманитарных, юридических, инженерных, компьютерных, физико-математических наук, а также креативных индустрий. В университете действуют 47 центров превосходства, или международных лабораторий. Вышка объединяет ведущих мировых исследователей в области изучения мозга, нейротехнологий, биоинформатики и искусственного интеллекта. Университет входит в первую группу программы «Приоритет-2030» в направлении «Исследовательское лидерство». Кампусы НИУ ВШЭ расположены в четырех городах — Москве, Санкт-Петербурге, Нижнем Новгороде и Перми, а также в цифровом пространстве — «Вышка Онлайн».
Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK
Предстоящие мероприятия
Вчера, 15:22
Nadya

Земля начала формироваться примерно 4,5 миллиарда лет назад. Чтобы понять, как это происходило в ранние периоды развития нашей планеты, ученые ищут образцы древних горных пород. Одну из таких, возрастом почти 3,5 миллиарда лет, обнаружили рядом с городом Колли в Австралии.

Позавчера, 11:38
МПСУ

Эмоциональное выгорание ИТ-специалиста напрямую связано с его личностными характеристиками. С профессиональными перегрузками и стажем связи нет. К такому выводу пришли ученые МПСУ, которые исследовали ИТ-специалистов двух компаний. Жизнестойкость, то есть способность человека выдерживать стрессовые ситуации без снижения успешности деятельности, в совокупности с внутренней положительной мотивацией формируют иммунитет к эмоциональному выгоранию специалиста в ИТ-сфере. Блокаторами стали интерес к работе и профессиональная удовлетворенность.

Позавчера, 11:06
НИУ ВШЭ

Энцелад — один из крупнейших спутников Сатурна, где потенциально может существовать внеземная микробная жизнь. Исследователи НИУ ВШЭ и ИКИ РАН вычислили характеристики пылевой плазмы и электрических полей, а также концентрацию фотоэлектронов вблизи поверхности спутника. Несмотря на удаленность Энцелада от Солнца, фотоэффект на его поверхности оказался важен для формирования пылевой плазмы.

Вчера, 15:22
Nadya

Земля начала формироваться примерно 4,5 миллиарда лет назад. Чтобы понять, как это происходило в ранние периоды развития нашей планеты, ученые ищут образцы древних горных пород. Одну из таких, возрастом почти 3,5 миллиарда лет, обнаружили рядом с городом Колли в Австралии.

18 июня
Сколтех

Ученые из Сколтеха, Цзилиньского университета и Центра передовых исследований в области науки и технологий высокого давления в Пекине (HPSTAR), а также их немецкие коллеги синтезировали и исследовали новый тип сверхпроводника с высоким содержанием водорода — супергидрид лантана типа A15 с формулой La4H23. Новый материал обладает сверхпроводимостью при температуре ниже −168 градусов и давлении в 1,2 миллиона атмосфер.

19 июня
ПНИПУ

Шаровая молния — выдумка или реальное явление, что такое темная материя и как она влияет на массу Вселенной? Для чего предназначены узоры на кончиках пальцев? Как мы «заражаемся» зевотой и почему мы чихаем, глядя на солнце? Отчего правшей больше, чем левшей и что нужно, чтобы сработал эффект плацебо? Об этом рассказали ученые Пермского Политеха.

24 мая
Игорь Байдов

С помощью космических и наземных телескопов международная команда астрономов открыла похожий на нашу планету мир в так называемой зоне обитаемости, позволяющей воде существовать на поверхности тела в жидком состоянии. По космическим меркам экзопланета находится достаточно близко к Земле и, вероятно, представляет собой скалистый мир с благоприятным для жизни климатом. Подобные миры астрономы открывают крайне редко.

27 мая
Андрей

Европейские гляциологи, используя первые снимки Восточной Антарктиды 1937 года, а также фотографии середины XX века и современные спутниковые данные, отследили, как менялись ледники в этом регионе на протяжении 85 лет.

10 июня
Александр Березин

Исследователи из США выяснили, что примерно два миллиона лет назад Солнечная система захватила хвост облака холодного межзвездного газа. В результате гелиосфера сильно сжалась, дав галактическим лучам свободно облучать все планеты системы. Это должно было вызвать и серьезные проблемы с климатом.

[miniorange_social_login]

Комментарии

Написать комментарий
Подтвердить?
Подтвердить?
Причина отклонения
Подтвердить?
Не получилось опубликовать!

Вы попытались написать запрещенную фразу или вас забанили за частые нарушения.

Понятно
Жалоба отправлена

Мы обязательно проверим комментарий и
при необходимости примем меры.

Спасибо
Аккаунт заблокирован!

Из-за нарушений правил сайта на ваш аккаунт были наложены ограничения. Если это ошибка, напишите нам.

Понятно
Что-то пошло не так!

Наши фильтры обнаружили в ваших действиях признаки накрутки. Отдохните немного и вернитесь к нам позже.

Понятно
Лучшие материалы
Войти
Регистрируясь, вы соглашаетесь с правилами использования сайта и даете согласие на обработку персональных данных.
Ваша заявка получена

Мы скоро изучим заявку и свяжемся с Вами по указанной почте в случае положительного исхода. Спасибо за интерес к проекту.

Понятно
Ваше сообщение получено

Мы скоро прочитаем его и свяжемся с Вами по указанной почте. Спасибо за интерес к проекту.

Понятно