Кто мы?

Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.

Что мы делаем?

В нашей компетенции — создание, тестирования и вывод в промышленную среду моделей для ключевых направлений команды: FX Trading, Commodities, Equity, Founding, Fixed Income, Rates, Credit Valuation Adjustment, Structured Products.

Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных, в том числе, занимаемся текстовой аналитикой.

Обязанности

Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4)
Построение пайплайна обработки данных и обучения LLM (LLM цепочек)
Разработка векторизованных баз знаний с использованием LangChain, ChromaDB
Организация процесса мониторинга качества LLM
Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
Участие в формировании требований и необходимых данных по улучшению моделей
Оценка как полученное решение достигает поставленных целей
Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике
Разработка документации и руководства для пользователей и разработчиков
Подготовка и анализ новостей для обучения модели

Требования

Основные навыки

Знание Python на уровне middle-разработчика
Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly)
Опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests)
Опыт работы с БД (ORM)
Опыт создания dashboards (streamlit/gradio/dash)
Опыт асинхронного программирования (asyncio)
Linux
Git
Docker

Навыки NLP

Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении
Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу
Знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений
Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений
Знание методов Prompt Engineering

Личностные качества

Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов.

Проекты

Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM.
Наличие блога по NLP/LLM

Условия

Формат работы: офис (ул.Вавилова,19)
ДМС с первого дня
Скидки на продукты банка и экосистемы
Развитая IT архитектура
Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях
Развитое DS community, регулярные митапы, дайджесты и конференции

Data Scientist LLM (Global markets)