Наш стек:
Аналитика: Python ML stack, Python NLP stack, JupyterLab
Внедрение и разработка: Docker, BitBucket, MLFlow, Dagster, VSCode, Teamcity, Nexus
ETL-процессы: Airflow, Kafka, Hadoop, Spark
БД: PostgreSQL, Oracle, Clickhouse
Чем предстоит заниматься:
- Разработка machine-learning алгоритмов в рамках проверки новых продуктовых гипотез, (максимально широкий набор процессов и областей деятельности, существующих в банке - Risk, CRM, Sales, Operations, Collection, Finance и т.д.; предсказательные модели, сегментирование по клиентам, модели по борьбе с мошенничеством, технологии обработки неструктурированных документов и массивов текстовых данных и т.п.);
- Участие во всех циклах ML-разработки: подготовка необходимых данных (анализ источников, очистка и преобразование), построение моделей, техническое тестирование алгоритмов на работоспособность, функциональное тестирование для проверки выполнения бизнес задачи, документирование, настройка мониторингов и взаимодействие с Devops для продуктивизации разработки.
Что мы ждём:
- Опыт разработки и продуктивизации моделей машинного обучения от 1 года. Приветствуется опыт в сфере розничного кредитования (риски, CRM);
- Способность видеть и понимать, как и что можно улучшить в процессах компании используя данные и модели. Умение погружаться в данные, искать инсайты, понимать ограничения. Ответственный подход к валидации качества построенных моделей, знание методов тестирования статистической значимости полученных результатов;
- Знание методологии и принципов разработки моделей, а также стека применяемых технологий и подходов к сбору, обработке, хранению и управлению данными.