В Lenta tech разработали систему прогнозирования спроса, которая ежедневно пересчитывает около 15 млн временных рядов для 2500 магазинов и 50 товарных групп. В основе платформы — современные методы машинного обучения: ансамбли градиентного бустинга с продвинутым feature-engineering и авторегрессионные модели на базе библиотек LightGBM и XGBoost.
Точность прогноза спроса напрямую влияет на финансовый результат: ошибка в оценке будущих продаж приводит либо к пустым полкам и упущенной выручке, либо к переизбытку товара и списаниям. Внедрение машинного обучения позволило быстрее реагировать на изменение трендов, сократить дефицит ключевых товаров в пиковые периоды, снизить списания скоропортящихся позиций и оптимизировать страховые запасы.
Модели сегментированы по направлениям, формату магазина и товарной категории — это устраняет лишний «шум» и повышает качество обучения. Для предсказания аномальных всплесков спроса существуют отдельные вероятностные модели. Качество системы отслеживается по метрикам WAPE и MAPE, плановое переобучение проводится раз в полтора месяца, а при резких изменениях данных или бизнес-процессов — внепланово.
Отдельного подхода потребовала категория свежих овощей и фруктов с её резкими сменами тренда и выраженной сезонностью. Для неё применяется авторегрессия в XGBoost, которая обеспечивает лучшую производительность при малом количестве данных и позволяет точнее отслеживать ранние и поздние входы и выходы из сезона.
Команда Lenta tech продолжает развивать платформу: в планах — построение специализированных моделей под различные категории и периоды, новые архитектурные и алгоритмические улучшения.
С полной версией статьи Николая Питухина, руководителя команды «Прогнозирование», можно ознакомиться по ссылке.