NLP Engineer/NLP Data Scientist

Оплата не указана

Вакансия находится в архиве

ТехЛАБ

г. Санкт-Петербург

Требуемый опыт работы

От 1 года до 3 лет

Тип занятости

Полная занятость

График работы

Полный день

Компания ТехЛаб - создатель высокотехнологичных IT‑решений для государственных и частных компаний, мы создаем решения от идеи до получения результата, предлагая свою отраслевую экспертизу.

Проекты компании направлены на автоматизацию процессов работы медицинского персонала, улучшение качества и доступности медицинских услуг за счет анализа и обработки медицинских данных.

Наш проект растет, и мы ищем нового члена нашей дружной команды - специалиста по Data Science с опытом в NLP.

Основные задачи:

  • Анализ и обработка больших объемов неструктурированных или слабоструктурированных медицинских текстовых данных;
  • Разработка и реализация алгоритмов для классификации, кластеризации и извлечения полезной информации из медицинских текстов;
  • Создание NLP-моделей для обработки естественного языка;
  • Сотрудничество с командой разработчиков для интеграции разработанных моделей в конечные продукты;
  • Участие в полном цикле ML-разработки от исследования до внедрения и мониторинга;
  • Взаимодействие с медицинскими экспертами для улучшения качества и релевантности результатов обработки информации;
  • Генерация гипотез и поиск точек роста продуктов на основе данных историй взаимодействия с пользователями;
  • Разработка новых подходов и процессов разметки данных для оценки качества работы моделей;
  • Оптимизация пайплайна исполнения на CPU/GPU инфраструктуре.
Требования:
  • Хорошие знания Python и умение писать понятный, качественный, чистый код;
  • Опыт работы над NLP-задачами от двух лет;
  • Глубокие знания в области машинного обучения и анализа текстов, включая опыт работы с библиотеками NLP (NLTK, SpaCy, Gensim, pyonmttok и пр.);
  • Знание классических методов: tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM;
  • Опыт работы с MLFlow, Docker, Streamlit, FastAPI, TensorFlow, традиционным DS-стеком (numpy, pandas, matplotlib, sklearn);
  • Опыт работы с git;
  • Опыт доведения ML моделей до продакшн стадии;
  • Умение работать с большими объемами данных, разработка оптимальных алгоритмов для эффективной обработки.
  • Высшее образование в области компьютерных наук, прикладной математики, статистики или в смежных областях;

Будет плюсом:

  • Опыт в области анализа медицинских текстов или работы над проектами в области здравоохранения;
  • Опыт запуска пилотных проектов и проведения А/В тестов;
  • Опыт работы с SQL;
  • Опыт работы с инструментами разработки и CI/CD;
  • Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т.п.), LLM (+ методов их тюнинга RAG, RLHF, LoRa).
Условия:
  • Официальное трудоустройство;

  • Современный офис в пешей доступности от м. Гостиный двор;
  • Гибридный формат работы. Вы можете работать как в офисе, так и дома;
  • Конкурентоспособную заработную плату (обсуждается индивидуально, зависит от вашего опыта и квалификации);
  • Расширенный социальный пакет: ДМС (включая стоматологию), компенсация питания, мотивационная программа, корпоративное обучение;
  • Возможность профессионального и карьерного роста;
  • Участие в социально значимом проекте;
  • Зона отдыха, вкусный кофе и печеньки;
  • Дружный коллектив.

Если вы хотите участвовать в амбициозных, социально значимых проектах по разработке и внедрению IT решений присоединяйтесь к нашей профессиональной команде!

Ключевые навыки

Python
Ms power bi
Apache opennlp
Mlflow
Sfml (simple and fast multimedia library)
Django rest pandas

Адрес

Санкт-Петербург, Итальянская улица, 17

Контактная информация

ТехЛАБ

Сайт: teh-lab.ru

Почта: не указана

Вакансия опубликована 31.07.2024 в г. Санкт-Петербург.

Похожие вакансии

#

Казань

Полный день

Подробное описание

23 июля

#

Москва

Деловой центр

и еще 1 станция

Полный день

Подробное описание

17 июля

#

Не указана

Москва

Полный день

Подробное описание

16 июля