Data Scientist (Middle)

Оплата не указана

Вакансия находится в архиве

МАТРИ

Сколково

г. Москва

Требуемый опыт работы

От 3 до 6 лет

Тип занятости

Полная занятость

График работы

Полный день

Компетенции

Middle

МАТRИ – это очень амбициозный проект, который на техническом уровне создает открытый стек технологий для децентрализованного AI. Когда это будет сделано, модели, аналогичные GPT от OpenAI будут доступны всем желающим на равноправных и недискриминационных условиях.

Однако, любая децентрализованная платформа по умолчанию является платформой с нулевым доверием. Это ставит перед нами важную технологическую задачу - обеспечение конфиденциальности данных. Нужно дать возможность пользователю хранить и давать доступ к своим данным, но при этом исключить несанкционированный доступ к ним.

ДАМАСК – это первый из системообразующих продуктов MATRИ-стека, который отвечает на этот вызов

ДАМАСК обеспечивает конфиденциальность данных и делает утечки данных бесполезными

В команде 5 человек, сейчас активно ищем опытного и уверенного Middle Data Scientist.


Технические навыки:

  • Глубокое знание Python и/или R, опыт использования библиотек для анализа данных (Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch).
  • Умение разрабатывать и тестировать модели машинного обучения (регрессия, классификация, кластеризация).
  • Понимание архитектур глубокого обучения (нейронные сети, RNN, CNN, LSTM, Transformer).
  • Опыт использования фреймворков для глубокого обучения (TensorFlow, Keras, PyTorch).
  • Понимание работы трансформеров и GPT-моделей, опыт их использования или интеграции в проекты.
  • Опыт работы с языковыми моделями, включая fine-tuning, обучение с нуля, работа с предобученными моделями (например, GPT, BERT).

Знание архитектуры и принципов работы трансформеров и GPT-моделей:

  • Понимание механизма self-attention, многоголовых механизмов внимания, positional encoding, работы слоев трансформеров.
  • Опыт работы с генеративными языковыми моделями (GPT-3, GPT-4 и др.).
  • Умение применять GPT для генерации текста, решения задач обработки естественного языка (NLP) — классификация текста, извлечение сущностей, машинный перевод.

Технический стек:

  • Опыт работы с SQL для извлечения данных.
  • Знание основ статистики, A/B тестирования и интерпретации результатов.
  • Опыт работы с большими данными (Big Data), в том числе работа с распределёнными системами (Hadoop, Spark).
  • Опыт работы с облачными платформами для машинного обучения (AWS, Google Cloud, Azure).

Опыт работы:

  • 2-4 года опыта работы в области Data Science.
  • Опыт работы с крупными наборами данных, их очисткой, трансформацией и анализом.
  • Реализованные проекты, включающие внедрение машинного обучения или глубокого обучения для решения бизнес-задач.

Условия:

  • Гибкое начало рабочего дня, мы вам доверяем;
  • Разумный гибрид - 1-2 дня нужно бывать в офисе для встреч с командой (Сколково, БЦ Амальтея);
  • ДМС со стоматологией оформляем с после испытательного срока;
  • Обучение и помощь в развитии - мы вкладываемся в ваше профессиональное развитие;
  • У нас работают адекватные и приятные люди, не душные и не снобы.

Как мы нанимаем:

  • Короткое интервью с HR по телефону;
  • Техническое собеседование с тимлидом команды максимум на 1,5 часа;
  • Оффер или обратная связь по встрече.

Ключевые навыки

Python
Сверточные нейронные сети
Tensorflow
Keras
Libtorch (pytorch c++ api)
Self-attention
Positional encoding
Gpt-3
Chat gpt-4
Sqlite
Big data
Apache hadoop
Spark framework
Microsoft azure

Адрес

Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 40

Контактная информация

МАТРИ

Сайт: dmask.ru

Почта: не указана

Вакансия опубликована 21.10.2024 в г. Москва.

Похожие вакансии

#

Не указана

Москва

Удаленная работа

Подробное описание

24 октября

#

Не указана

Москва

Войковская

Гибкий график

Подробное описание

25 октября

#

Москва

Удаленная работа

Подробное описание

12 апреля