Колумнисты

Ученые спрогнозировали розничные продажи с помощью нового алгоритма

В современной экономике, где объемы продаж растут в геометрической прогрессии, умение предвидеть, какие товары будут пользоваться спросом, можно назвать залогом успеха для любого бизнеса. Ученые МТУСИ предложили решение для такого прогноза.

Как правило, данные о продажах формируют непрерывный поток информации в датасет, где каждая группа «товар-магазин» представляет собой обособленный временной ряд, который по отдельности невозможно проанализировать вручную и представить графически. Традиционные статистические методы не справляются с такими объемами информации и сложными взаимосвязями между различными факторами, влияющими на спрос. Решением проблемы может стать машинное обучение, однако его эффективность напрямую зависит от скорости и точности вычислений, объема данных и доступных вычислительных ресурсов.

Сотрудники кафедры «Математическая кибернетика и информационные технологии» (МКиИТ) факультета «Информационные технологии» МТУСИ — доктор технических наук профессор Юрий Леохин и кандидат технических наук, доцент Тимур Фатхулин — провели масштабное исследование, посвященное поиску оптимального решения для прогнозирования спроса на отдельные виды товаров.

В рамках исследования были отобраны и протестированы различные модели машинного обучения, включая Random Forest, Linear Regression, XGBoost, LightGBM, CatBoost и LSTM. Для оценки эффективности каждой модели использовались три ключевые метрики: RMSE (среднеквадратичная ошибка), MAE (средняя абсолютная ошибка) и R2 (коэффициент детерминации). Для обучения и тестирования моделей использовались реальные данные о продажах.

«Данные метрики являются универсальными, а их использование вместе позволяет более полно оценить поведение моделей, что было определено в ходе анализа рассматриваемой предметной области. Далее мы отобрали данные из открытых источников, чтобы разработать универсальную модель, которая будет эффективно работать в разных условиях и с отдельными типами товаров. Мы загрузили в модели датасет с данными о продажах фирмы «1С» (16 249 записей из 67 товарных групп в 13 магазинах за 34 месяца), розничной сети Эквадора (24 090 записей, включающих 33 товарных групп за 730 дней) и розничных магазинов в различных регионах страны (15 800 записей о четырех видах товара в пяти магазинах за 790 дней)», – поделился особенностями исследования профессор, доктор технических наук, Юрий Леохин.

Результаты исследования показали, что наиболее эффективной моделью для прогнозирования спроса является XGBoost – модель градиентного бустинга.

«XGBoost – это универсальная и мощная модель, ориентированная на высокую производительность, масштабируемость и точность. Она продемонстрировала наивысшую точность и стабильность прогнозов по сравнению с другими рассмотренными моделями. Тщательная настройка параметров и правильный выбор признаков в данных позволят в будущем еще больше повысить точность и эффективность данной модели», – пояснил доцент, кандидат технических наук Тимур Фатхулин.

В дальнейшем исследователи планируют продолжить работу над совершенствованием модели, уделяя особое внимание настройке параметров и подбору оптимальных признаков в данных.

Исследование, проведенное учеными МТУСИ, открывает новые горизонты для создания интеллектуальных систем, способных с высокой точностью прогнозировать спрос в различных отраслях: от розничной торговли до крупного производства.