Data Scientist LLM (Global markets)

Оплата не указана

Вакансия находится в архиве

СБЕР

г. Москва

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Полный день

Кто мы?

Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.

Что мы делаем?

Департамента Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты.

Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных.

Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей .

Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). В этой роли вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.

Обязанности

  • Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4);
  • Построение пайплайна обработки данных и обучения LLM (LLM цепочек);
  • Разработка векторизованных баз знаний с использованием LangChain, ChromaDB;
  • Организация процесса мониторинга качества LLM;
  • Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения;
  • Участие в формировании требований и необходимых данных по улучшению моделей;
  • Оценка как полученное решение достигает поставленных целей;
  • Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике;
  • Разработка документации и руководства для пользователей и разработчиков;
  • Подготовка и анализ новостей для обучения модели.

Требования

Основные навыки

  • Знание Python на уровне middle-разработчика;
  • Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly);
  • Опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests);
  • Опыт работы с БД (ORM);
  • Опыт создания dashboards (streamlit/gradio/dash);
  • Опыт асинхронного программирования (asyncio);
  • Linux;
  • Git;
  • Docker.

Навыки NLP

  • Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении;
  • Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу;
  • Знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений;
  • Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений;
  • Знание методов Prompt Engineering.

Личностные качества

  • Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов.

Проекты

  • Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM;
  • Наличие блога по NLP/LLM.

Условия

  • Формат работы: офис (ул.Вавилова,19). Возможен гибрид;
  • ДМС с первого дня;
  • Скидки на продукты банка и экосистемы;
  • Развитая IT архитектура;
  • Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;
  • Развитое DS community, регулярные митапы, дайджесты и конференции.

Контактная информация

СБЕР

Сайт: sber.ru

Почта: не указана

Вакансия опубликована 16.04.2024 в г. Москва.

Похожие вакансии

#

Не указана

Москва

Бауманская

и еще 2 станции

Полный день

Чем предстоит заниматься:

  • Приемкой и поддержкой реализованной функциональности;

  • Улучшением алгоритмов моделей;

  • Полным циклом разработки продукта: от выгрузки обучающей выборки до внедрения в prod...

1 июля

#

Не указана

Санкт-Петербург

Гибкий график

Банк «Санкт-Петербург» - крупнейший коммерческий банк Северо-Западного региона России. Внутри Банка функционирует и успешно развивается Дирекция Казначейство - структурное подразделение, состоящее финансовых аналитиков, разработчиков, экономистов...

24 апреля

#

от 150 000 ₽

Москва

Полный день

Университет науки и технологий МИСИС является одним из лидеров технологического образования в России, динамично развивающимся научно-образовательным центром мирового уровня. В университете сформирована творческая интернациональная академическая атмосфера, мы будем рады принять в нашу...

8 мая