Вопрос наш болезненный и сложный как для крупных, так и для мелких банков.
Для крупных – потому что в них не только собираются все возможные данные, но и есть специальные схемы в базах данных для отдела риск-менеджмента или управления моделирования. И часто качество этих данных оставляет желать лучшего.
В небольших банках системная работа с данными обычно не ведется. Собираются только транзакционные данные – для обслуживания клиента и регулятивные – для отчетности. То, что нужно рисковикам: расчетные данные, данные для моделей, финансовые показатели, результаты их предыдущих расчетов, – в базах отсутствует.
Поэтому часто рисковики хранят много данных в Excel. Причем через полгода или год после завершения масштабных расчетов нужно снова обращаться к этим данным и вспоминать логику – почему они именно такие и откуда взялась та или иная цифра.
Если вы, понимая, что так работать больше невозможно, пойдете к своему руководителю, в департамент ИТ или еще куда-то с предложением “давайте решим вопрос с данными” – все будет сведено на нет.
В больших банках – потому что нужна масса согласований от ИТ, а ИТ – это огромная фабрика и им порой самим сложно разобраться в этом хозяйстве. В небольших – потому что никто не будет брать на себя ответственность (если только это не приводит к заработку денег). В небольших современных банках, конечно, сильная ИТ-составляющая, но этот вопрос может решаться без вас и результат будет совсем не таким, как вы ожидали.
Все это действительно очень болезненно. До тех пор, пока рисковик не сменит свое мышление и не перестанет быть винтиком в системе. Что нужно сделать:
- Получите права сисадмина на свой локальный компьютер и установите на нем PostgreSQL. Почему именно ее?
- Эта база промышленная по мощности, то есть ни в чем не уступает решениям от Oracle. В ней можно хранить десятки и сотни тысяч гигабайтов данных.
- Среди баз с открытым исходным кодом она самая мощная и быстроразвивающаяся. Вокруг нее создана целая инфраструктура, в ее развитии задействовано много русских специалистов, есть локализованная российская версия, многочисленные туториалы и вопросы-ответы на Stack Overflow и Stack Exchange.
- Работает база “на чайнике” – она конфигурирована так, что может работать даже на компьютере из 90-х. Если компьютер современный, можно самому “выкрутить” нужную конфигурацию.
- Изучите SQL и PL/SQL. Как правило, рисковики знают SQL, но в части select – выборок из существующих баз. Тут же нужны create, update, insert, constraint – то, что связано именно с проектированием, с DBA (Data Base Administration).
Ваши усилия обязательно окупятся. Почему? Однажды создав “свою кухню” – собственные правила, вы уже не будете их нарушать. И если, например, вам нужно раз в год актуализировать модели – вы будете знать, по каким правилам формируются исходные данные. Если вы ведете предварительные расчеты на Python или даже в Excel – вы будете знать, что исходные данные для модели должны быть чистыми. Соответственно вы постараетесь готовить данные в таком виде, чтобы потом загружать их в свою базу.
И дальше эта база просто версионируется, накладывается на временные отрезки. Если речь о корпоративных кредитах или кредитах МСБ – то сохраняется финансовая отчетность, потому что в крупных банках финансовая отчетность хранится незамысловато. Рисковик отправляет те срезы отчетности, которые ему нужно сохранить, в ИТ, а потом оказывается, что из-за каких-нибудь запятых все загрузилось “криво”.
Поэтому ответ один: стать предпринимателем внутри своего банка и самостоятельно организовать хранение на локальной машине. Как обычно, профессионализм и терпение преодолевают любое корпоративное препятствие.
Так что желаю всем нам стать рисковиками с самыми чистыми, дистиллированными данными, в которых мы будем уверены.