Кто мы?
Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.
Что мы делаем?
В нашей компетенции — создание, тестирования и вывод в промышленную среду моделей для ключевых направлений команды: FX Trading, Commodities, Equity, Founding, Fixed Income, Rates, Credit Valuation Adjustment, Structured Products.
Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных, в том числе, занимаемся текстовой аналитикой.
Обязанности
- Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4)
- Построение пайплайна обработки данных и обучения LLM (LLM цепочек)
- Разработка векторизованных баз знаний с использованием LangChain, ChromaDB
- Организация процесса мониторинга качества LLM
- Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения
- Участие в формировании требований и необходимых данных по улучшению моделей
- Оценка как полученное решение достигает поставленных целей
- Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике
- Разработка документации и руководства для пользователей и разработчиков
- Подготовка и анализ новостей для обучения модели
Требования
Основные навыки
- Знание Python на уровне middle-разработчика
- Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly)
- Опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests)
- Опыт работы с БД (ORM)
- Опыт создания dashboards (streamlit/gradio/dash)
- Опыт асинхронного программирования (asyncio)
- Linux
- Git
- Docker
Навыки NLP
- Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении
- Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу
- Знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений
- Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений
- Знание методов Prompt Engineering
Личностные качества
- Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов.
Проекты
- Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM.
- Наличие блога по NLP/LLM
Условия
- Формат работы: офис (ул.Вавилова,19)
- ДМС с первого дня
- Скидки на продукты банка и экосистемы
- Развитая IT архитектура
- Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях
- Развитое DS community, регулярные митапы, дайджесты и конференции