Тренд на использование больших данных в ключевой для банков задаче кредитного скоринга начался несколько лет назад, когда стартовали первые проекты с применением открытых данных из интернета, и сейчас набирает обороты. Подключение дополнительных источников данных делает оценку платежеспособности клиента более точной.
Банк Хоум Кредит и компания SAS объявляют открытый конкурс по анализу данных, собираемых из различных источников. Конкурс стартует 1 августа и продлится четыре месяца. Участвовать в нем могут все, кто хочет попробовать свои силы в кредитном скоринге, как профессиональные аналитики, так и любители, молодые специалисты и студенты, для которых предусмотрен специальный приз.
Участникам предлагается разработать модель кредитного скоринга, основанную на анализе обезличенных персональных данных о поведении клиентов, в том числе данных, полученных из внешних источников. Особенность предлагаемой задачи заключается в том, что данные могут быть неполными, например, не содержать информации о части выданных кредитов, и противоречивыми. Это максимально приближает условия к реальным.
Для выполнения задачи можно использовать любое свободно распространяемое аналитическое программное обеспечение (включая R, Python и другие инструменты), бесплатную версию программного обеспечения SAS University Edition, а также собственные решения, реализованные на общеизвестных языках программирования, таких как java, c++, perl, C#. При разработке моделей участники конкурса не должны нарушать лицензионные права на используемое программное обеспечение, права интеллектуальной собственности на используемые или предлагаемые модели.