Разработанная модель позволяет получать прогнозы выручки текущего года по всем активным ИНН на девять месяцев раньше, чем данные результаты публикуются официально. Это дает возможность заранее планировать работу с компаниями. К тому же с помощью новой модели можно получать прогнозы в том числе и по ИП, информации о которых пока нет ни в одном открытом источнике.
В данном случае была использована модель класса black box, основанная на деревьях решений — Random Forest Regression.
Станислав Карташов, директор дивизиона «Корпоративные клиенты 360» блока «Корпоративно-инвестиционный бизнес» Сбербанка:
«ML-модель такого типа создается в течение как минимум трех месяцев и предполагает масштабное исследование более 1000 признаков. С ее помощью мы здесь и сейчас, не дожидаясь завершения календарного года и официальной бухгалтерской отчетности, видим потенциал клиента. Более того, она обогащает другие разрабатываемые нами модели, что позволяет нам предвосхищать ожидания и потребности наших клиентов».