Инвестиционная платформа Smally специализируется на предоставлении займов поставщикам на рынке госзакупок в сегменте микро- и малого бизнеса. Специфика клиентов платформы в том, что это активно растущие компании с нестабильным бизнесом, работающие в сфере с высоким риском неисполнения контракта. Поэтому, определяя вероятность выхода таких заемщиков в просрочку, сложно ориентироваться на исторические данные.
Чаще всего на таких платформах используется коэффициентный анализ.
Методы коэффициентного анализа описаны в книге Владимира Козлова «Хардкорный риск-менеджмент в картинках».
Внутренней экспертизой для создания скоринга компания Smally не обладала. Для разработки системы, учитывающей особенности клиентской базы, было принято решение привлечь компанию Raisk. Важно, что этот разработчик, в отличие от ряда других, предлагал результат разработки в единоличное пользование заказчика и не стремился сделать открытый продукт.
Для решения поставленной задачи разработчик применил банковский продвинутый подход к управлению кредитным риском – IRB-подход. В этой статье мы расскажем, как была построена модель и каких результатов позволила достичь.
Как строилась модель
Теоретическая база
1. Общие принципы и требования к IRB-моделям вероятности дефолта, изложенные в документе Базельского комитета по банковскому надзору “Studies on the Validation of Internal Rating Systems” (Working Paper No. 14).
2. Принципы оценки вероятности дефолта, описанные в документе Европейской службы банковского надзора (EBA) “Guidelines on PD estimation, LGD estimation and treatment defaulted exposures” (EBA/GL/2017/16).
Одновременно учитывались особенности клиентского сегмента, качество исходных данных и характер продукта компании Smally.
Суть модели
Рейтинговая система построена на модели логистической регрессии в среде Python 3.8. В основе модели – биномиальное распределение.
Модель определяет вероятность принадлежности того или иного наблюдения к бинарному таргету «NPL0+». Для этого используются данные, нормализуемые через стандартизированный WoE-биннинг. Рассчитанные вероятности переводятся в скоринговый балл с помощью мастер-шкалы. Мастер-шкала укрупнена для инвесторов компании.
Особенности подобранных признаков
1. Обладают WoE-монотонностью.
2. Соответствуют экономической логике переменной, в том числе согласно тренду Default Rate (DR).
3. Содержат минимально необходимое количество наблюдений в каждом бине (более 5%).
4. Не пересекаются по DR-тренду на 80-м доверительном интервале Уилсона*.
5. Не коррелируют с отобранными признаками (с коэффициентом корреляции Пирсона).
6. Улучшают Gini всего классификатора не менее чем на 1 п.п.
7. Имеют достаточное p-значение (меньше 0.1) в собранном классификаторе.
8. Имеют VIF (коэффициент инфляции дисперсии) менее 4.
* Wilson E.B. Probable inference, the law of succession, and statistical inference // Journal of the American Statistical Association, 1927, 22: 209–12.
Отбор признаков
Для отбора были обработаны более 500 признаков, их комбинации, группировки, кодирование, исключая one-hot-encoding (преобразование категориальных переменных в числовые).
В качестве метода однофакторного анализа выбран однофакторный отсев по Gini, меньшему 0.1, и корреляции, большей 0.5, по таргету, полученному следующей процедурой расчета:
1. Если известны фактическая и плановая даты погашения займа, таргетом = 1 является разница указанных дат при условии, что она строго больше 0.
2. Если одна из дат неизвестна, таргетом = 1 является установка статуса «Просрочен», «Просрочка», «Реструктуризация» в поле «Статус займа».
Пример отсева переменных:
Сокращенный список переменных был трансформирован в категориальные WoE-интервалы, WoE-признаки – стандартизированы с помощью функции Scaler.
Пример WoE-замены и стандартизации окончательно отобранных переменных:
Затем был проведен многофакторный анализ, отобранным переменным присвоены коэффициенты и веса. Gini получившегося классификатора – более 0.62.
Эксплуатация модели
К началу разработки скоринга компания выдала всего несколько сотен займов нескольким десяткам заемщиков. Сейчас через платформу прошло уже порядка 300 заемщиков, выдано более 2500 займов, и охват продолжает расти.
По результатам применения модели уровень просрочки снизился в 4 раза год-к-году (2022/2021), в 2023 г. просрочек не зафиксировано вообще.
Что же касается соблюдения регуляторных требований, то ЦБ пока еще не создал какую-либо стандартизированную систему мониторинга и учета рисков в сфере инвестиционных платформ, но все к этому идет. В любом случае наличие профессиональной модели и ее описание дают инвестиционной платформе значительное преимущество, в том числе и в общении с ЦБ в настоящее время.
Особенность этого кейса не только в том, что был применен IRB-подход, но и в том, что решение компании Raisk безболезненно встроилось в сервис платформы. Созданный микросервис был представлен клиенту как готовое решение в Docker-контейнере с CI-CD (непрерывной интеграцией и доставкой). То есть продвинутые подходы к управлению рисками соединились в этом проекте с высокотехнологичными IT-подходами, которые редко применяют «классические» моделисты и риск-менеджеры.
Будем рады услышать несколько слов о скоринге в вашей компании. Респондентам дарим книгу Владимира Козлова «Хардкорный риск-менеджмент в картинках».