31 июля, 12:03

Редакция Naked Science

Исследователи Яндекса разработали новую нейросетевую архитектуру для работы с табличными данными

❋ 4.7

Лаборатория исследований искусственного интеллекта Yandex Research представила нейросетевую архитектуру для работы с табличными данными — TabM. Разработка позволяет быстро обрабатывать большие массивы данных и строить высокоточные прогнозы при умеренном использовании вычислительных ресурсов. Подобные модели могут использоваться в самых разных областях, от прогнозирования энергопотребления до классификации пациентов по риску заболеваний.

Технологии

# Yandex

# глубокое обучение

# нейросетевые технологии

Общая схема TabM / © Yury Gorishniy et al.

Научная работа о модели была представлена на ICLR — одной из крупнейших в мире конференций по искусственному интеллекту. Статья также опубликована в архиве научных статей препринтов Корнеллского университета. Сама архитектура выложена в открытом доступе на GitHub.

Классические модели градиентного бустинга на решающих деревьях (CatBoost, XGBoost, LightGBM) традиционно считались стандартом для работы с табличными данными. В последние годы для этих задач также активно разрабатываются нейросетевые архитектуры — от простых многослойных перцептронов (MLP) до более сложных моделей на основе трансформеров и retrieval-механизмов. При этом вопросы стабильности и эффективности новых методов на широком спектре табличных задач, а также возможности их практического применения, оставались открытыми.

В своей работе исследователи из лаборатории Yandex Research обратили внимание на потенциал улучшения MLP за счет параметро-эффективного ансамблирования. Они предложили архитектуру TabM, созданную на основе многослойного перцептрона с применением модифицированной техники BatchEnsemble. Внутри одной нейросетевой модели формируется несколько виртуальных подмоделей с частично общими параметрами, предсказания которых затем усредняются.

Такой подход позволил TabM не только превзойти базовые MLP и более сложные современные нейросетевые решения для табличных данных, но и достичь качества, сопоставимого или превосходящего лучшие классические модели градиентного бустинга. Тестирование проходило на 46 наборах данных, причем среднее место TabM в тестах оказалось между первым и вторым (усредненно 1,7).

Это очень хороший результат, потому что в норме подобные модели делают точные прогнозы только для некоторых наборов данных, под которые их оптимизировали при разработке. Обычная модель редко занимает первые и вторые места сразу в десятках наборах данных. Например, ближайший конкурент TabM в среднем занимал места, ближе к третьему (2,9).

То есть TabM оказалась лидером по универсальности. Это важно, поскольку разрабатывать специализированную модель под каждый новый набор данных долго, дорого и не всегда гарантирует наилучшее качество. В отличие от альтернативных MLP-решений, архитектура TabM универсальна: ее можно применять без глубокой донастройки. Таким образом, специалисты получают новый эффективный и более легкий в использовании инструмент.

На практике TabM уже применили на Kaggle. Это платформа международных соревнований по анализу данных и машинному обучению от Google. Среди задач, для которых применяли TabM, было, например, предсказание выживаемости пациентов после трансплантации костного мозга. Сперва, при обучении, в модель загружали таблицу с данными пациентов с аналогичными диагнозами, в которых было указано, выжил пациент или нет. Затем обученная модель получала данные по нынешним пациентам и делала прогноз по их выживанию.

С 2019 года исследователи Yandex Research опубликовали восемь научных статей по глубокому обучению моделей для работы с табличными данными. В общей сложности статьи получили более 1900 цитирований. В частности, статью о TabM цитировали Университет Мангейма (Германия), Национальный университет Сингапура, Корейский университет, Иллинойсский университет в Урбане-Шампейне (США). В разные годы статьи были приняты на самые влиятельные конференции по ИИ, в том числе NeurIPS, ICLR и ICML.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl + Enter.

Технологии

# Yandex

# глубокое обучение

# нейросетевые технологии

Подписывайтесь на нас в Telegram, Яндекс.Новостях и VK

Дзен

Предстоящие мероприятия

Когда природа повторяет себя: удивительные двойники эволюции

Центр «Архэ»

Онлайн

Лекция

16 Дек

Бесплатно

Битва за Ржев и взятие Ржева

Российская государственная библиотека

Москва

Лекция

16 Дек

Бесплатно

Как сохранить и представить исторические источники?

Библиотека иностранной литературы

Москва

Центр «Архэ»

Москва

Лекция

16 Дек

750 ₽

Особенности русской средневековой культуры

Центр «Архэ»

Онлайн

Курилка Гутенберга

Москва

Лекция

18 Дек

Бесплатно

Медицинские нейротехнологии

Нейрокампус

Москва

Лекция

18 Дек

1200 ₽

В космос по цене авиабилета

Центр «Архэ»

Москва

Лекция

18 Дек

Бесплатно

Андрэ Дави — исследователь Нила

Библиотека иностранной литературы

Москва

Популярное

За сутки

За неделю

За месяц

15 декабря, 08:10

Любовь С.

Опубликована «дорожная карта» первой пилотируемой миссии на Марс

В конце 2025 года Национальные академии наук, инженерии и медицины США представили доклад, посвященный будущим пилотируемым миссиям к Марсу. В документе подробно описаны причины, по которым людям стоит отправиться на Красную планету, а также технологии, способные приблизить человечество к первой высадке.

Астрономия

# астронавты

# жизнь на Марсе

# колонизация Марса

# космические аппараты

# пилотируемый полет

# поверхность марса

13 декабря, 14:51

Игорь Байдов

В прошлом у Марса могла быть большая луна, которая управляла приливами

На Красной планете ученые нашли предполагаемую «каменную летопись» древних приливов. Эту запись могла оставить не существующая сегодня сила — гравитация луны, которая когда-то красовалась в марсианском небе и управляла «ритмом» морей.

Астрономия

# вода на марсе

# Деймос

# марс

# спутники Марса

# Фобос

15 декабря, 11:02

Игорь Байдов

Римские завоеватели подорвали здоровье британцев на несколько столетий

Акведуки, дороги, бани и города, которые римляне построили на оккупированных территориях, часто воспринимаются историками как символ прогресса. Но археологические раскопки, проведенные учеными из Великобритании, открыли обратную, мрачную сторону этого «развития». Оказалось, римское владычество на несколько поколений подорвало здоровье местного населения, особенно тех, кто жил в административных центрах. Исследователи увидели эту печальную картину в костях наиболее уязвимых групп населения — женщин и детей, которые первыми реагируют на ухудшение условий жизни.

Археология

# бритты

# кельты

# патологии

# Рим

# Римская Британия

15 декабря, 08:10

Любовь С.

Опубликована «дорожная карта» первой пилотируемой миссии на Марс

Астрономия

# астронавты

# жизнь на Марсе

# колонизация Марса

# космические аппараты

# пилотируемый полет

# поверхность марса

12 декабря, 13:48

Игорь Байдов

Морские биологи впервые зафиксировали совместную охоту косаток и дельфинов

У побережья Канады морские биологи стали свидетелями необычного случая. Косатки и дельфины объединили свои силы, чтобы вместе охотиться на тихоокеанского лосося. Они погружались в темные глубины, а после удачной охоты делились пищей. Это первое задокументированное охотничье сотрудничество между двумя видами морских млекопитающих.

Биология

# дельфины

# интеллект китообразных

# китообразные

# косатки

# морские виды

# морские животные

# охота

13 декабря, 14:51

Игорь Байдов

В прошлом у Марса могла быть большая луна, которая управляла приливами

Астрономия

# вода на марсе

# Деймос

# марс

# спутники Марса

# Фобос

8 декабря, 13:09

Александр Березин

Новая орбита национальной орбитальной станции лишит Россию возможности запускать космонавтов со своей территории

С 2010-х в «Роскосмосе» говорили: будущая РОС сможет пролетать над полюсом, что даст ей возможности для новых научных экспериментов. Но вскоре после того, как в ноябре 2025 года Россия временно лишилась возможности запускать людей в космос, эта позиция изменилась. В результате запускать космонавтов с космодромов нашей страны станет довольно сложно.

Космонавтика

# космос

# МКС

# Российская орбитальная станция

# Россия

29 ноября, 12:42

Александр Березин

Впервые в истории Россия временно лишилась возможности выводить людей в космос. Какие выводы сделают отрасль сильнее?

Позавчера, 27 ноября 2025 года, при запуске космонавтов к МКС на стартовую площадку № 31 упала кабина обслуживания стартового комплекса. Это означает, что новые пуски оттуда до починки невозможны. К сожалению, в 2010-х годах, в рамках «оптимизации» расходов, резервную площадку (с которой летал Юрий Гагарин) упразднили. Поэтому случилось беспрецедентное: в XXI веке страна с пилотируемой космической программой осталась без средств запуска людей на орбиту. Пока ремонт не закончится, проблема сохранится. Чем это может грозить?

Космонавтика

# «Союз МС»

# Байконур

# корабль Союз

# космодром «Восточный»

# космодром Байконур

# космос

# Роскосмос

# Россия

Выбор редакции

27 ноября, 20:20

Максим Абдулаев

Эксперимент подтвердил эффективность античного способа получения вина из изюма

Японские биологи повторили античную технологию производства вина из изюма, чтобы выяснить механизм его брожения. Исследователи показали, что сушеный виноград, в отличие от свежего, накапливает на поверхности дикие дрожжи и способен превращать воду в алкоголь без внесения дополнительных заквасок.

Археология

# алкоголь

# античность

# вино

# виноделие

# дрожжи

# история

# микробиология

[miniorange_social_login]

Исследователи Яндекса разработали новую нейросетевую архитектуру для работы с табличными данными

По теме

Глубокое машинное обучение использует «язык белков», чтобы предсказать их свойства

Нейронная сеть научилась предсказывать структуру и функции любых белков

Интернет-поисковики изменились ради 1 апреля

Популярное

Комментарии

Последние новости:

Биологи составили масштабный рейтинг полезных и вредных бактерий кишечника

Ученые создали комбучу с повышенной антиоксидантной активностью

Римские завоеватели подорвали здоровье британцев на несколько столетий

Как приручить йод: ученые нашли новый метод защиты перовскитных солнечных батарей от разрушения

Инфографика: сравнение российского термоядерного реактора с ИТЭР

Советское наступление под Москвой: почему Красная армия победила, несмотря на немецкое превосходство

Как Россия разрабатывает материалы для реакторов нового поколения — от земных АЭС до космических систем. Интервью с Алексеем Дубом

Какой ядерный реактор строить: тест ваших предпочтений

Последние комментарии

Самые обсуждаемые

«Аффект зомби»: философ описал новое психоэмоциональное состояние современного человека

Инфографика: сравнение российского термоядерного реактора с ИТЭР

Советское наступление под Москвой: почему Красная армия победила, несмотря на немецкое превосходство

Ученые объяснили физический принцип, стоящий за развитием рака и старением клеток