Data Scientist - NLP/LLM Engineer

Оплата не указана

Вакансия находится в архиве

Novel Software Systems

г. Москва

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Полный день

NOVEL - аккредитованная ИТ-компания. С 2004 г разрабатывает и поставляет программные продукты в области генетики, биоинформатики, биотехнологий. Также оказывает услуги по анализу и интерпретации генетических данных, в том числе с использованием методов искусственного интеллекта.

Требуется специалист по применению больших языковых моделей (LLM) к задачам обработки научного и медицинского текста (NLP). Вам предстоит проводить дообучение моделей на русском языке.

Задачи:

  • Улучшение поиска контента
  • Разбор запросов на естественном языке и выдача релевантных книг, глав, абзацев.
  • Кластеризация контента.
  • Создание системы поддержки принятия врачебных решений (СППВР) способной правильно отвечать на медицинские вопросы.
  • Создание помощника генерации медицинских документов: справок, выписок, заключений, отчетов.

Требования:

  • понимать принципы NLP;
  • ориентироваться в современном ландшафте языковых моделей;
  • опыт дообучения языковых моделей на корпусах текстов;
  • локально разворачивать и запускать открытые модели серий LLaMA, Mistral и дообученные с HugginFace;
  • уметь оркестровывать модели с помощью LangChain, LlamaIndex;
  • опыт работы с Big Data и векторными БД;
  • опыт с LoRa, RAG.

Будет плюсом:

  • умение прототипировать web-интерфейсы;
  • огранизация для проекта CI/CD;
  • владение знаниями биомедицинского домена;
  • обучение LLM для перевода с английского на русский.

Контактная информация

Novel Software Systems

Вакансия опубликована 16.07.2024 в г. Москва.

Похожие вакансии

#

до 80 000 ₽

Москва

Полный день

Подробное описание

21 октября

#

от 250 000 до 350 000 ₽

Москва

Удаленная работа

Подробное описание

22 августа

#

Middle

Москва

Удаленная работа

Подробное описание

14 августа