Как риск-менеджеру перейти в data science
И что делать, если вам за 40
Вы устроились на работу в крупный банк. Прошли конкурс — 50 человек на место. Но все, что вы сейчас делаете, — забиваете данные кредитных заявок в базу (кстати, это можно делать быстрее и эффективнее).
Или вы уже 15 лет работаете в одном и том же банке экономистом. Вам хочется зарабатывать больше, но перспектив карьерного роста у вас нет, а искать другую работу страшновато.
И тогда вы думаете: а может быть, освоить data science?
В чем проблема с data science
Да, data science — это профессия молодых. Но не потому, что у них лучше базовое образование или они быстрее обучаются. Просто люди старше 40 привыкли углубляться в детали. А в data science часто нужно разбираться в технологиях, но не в деталях этих технологий.
Достаточно знать, какими методами распознавать картинки, анализировать текст или видео. Какие параметры у этих технологий. Но что внутри технологий — многие даже не думают.
Рисковики “старой школы” привыкли знать, что внутри. Например, всем известно, что коэффициент наклона линейной регрессии вычисляется через ковариацию, деленную на дисперсию. Мы понимаем, что такое ковариация, что такое дисперсия и как они устроены.
Теперь возьмем для примера XGBoost — один из самых популярных алгоритмов в data science. Детальный учебник по алгоритму — страниц 300-400 — просто на верхнем уровне описывает его смысл. То же касается других современных алгоритмов.
И если мы зайдем на Kaggle, мы увидим, по крайней мере в финансах, примеры, которые с большой вероятностью не будут использоваться в “боевой среде”. Скорее всего, в нашем банке они не будут работать.
Их просто не примут, не поставят в продакшн и не сделают частью системы принятия решений. Почему? Потому что жизнь внутри кредитного учреждения гораздо более сложная.
Известный пример из небанковской сферы: математики получили от Нетфликс миллион долларов за чудо-алгоритм подбора фильмов. Но этот алгоритм так и не был реализован. Несмотря на его гениальность, он абсолютно небоеспособен.
Что делать
Все это не значит, что рисковик не должен идти в сторону data science. Он обязательно должен идти в эту сторону, а именно начинать кодить. И неважно, что вы делаете на своей работе.
Если вы кредитный аналитик, вы можете писать скрипты на Visual Basic в Excel. И здесь вам поможет наша книга.
Если вы работаете в рыночных рисках, то кодить наверняка умеете. Но старайтесь делать больше. Например, пробуйте облачные вычисления, которые сейчас очень быстро развиваются и в Google, и в Amazon. Это то, без чего профессия вряд ли сможет двигаться вперед.
Если вы работаете с банковскими данными, поищите методы, которые могут оптимизировать ваш труд. Пишите скрипт, а не просто решайте поставленную бизнесом задачу.
Например, ваша задача построить дефолтную модель Монте-Карло по кредитному портфелю. Финансисты просят показатели убытков, рассчитанные по определенной методологии. Попробуйте не просто посчитать убытки, а написать скрипт, который автоматически будет их считать.
И когда вы начнете писать, ваша работа подскажет сама, в чем вы слабы и куда двигаться.
Средние частные банки ценят специалистов, которые хорошо разбираются в чем-то. Неважно, датасаентист вы или нет — важно, понимаете ли вы, о чем идет речь. Как правило, это понимание работает даже лучше, чем навыки использования библиотек Python.
Поэтому всегда нужно стараться сделать еще один шаг к современным технологиям. Несомненный тренд нашей технологической профессии — люди, которые не умеют кодить, постепенно вытесняются сервисами и роботами. Так происходит, например, в трейдинге, где “живые” трейдеры только общаются с клиентами. С кредитным риском сложнее, но это вопрос времени.
Начинайте двигаться вглубь. Изучать Python, C#, VBA, C++, SQL. Как показала наша статистика, SQL сейчас в верхних строках требований работодателя наряду с Excel — потому что без баз никуда.
Так что попробуйте построить линейную регрессию на SQL — возможно, эта задача как раз для вас.