Компания ТехЛаб - создатель высокотехнологичных IT‑решений для государственных и частных компаний, мы создаем решения от идеи до получения результата, предлагая свою отраслевую экспертизу.
Проекты компании направлены на автоматизацию процессов работы медицинского персонала, улучшение качества и доступности медицинских услуг за счет анализа и обработки медицинских данных.
Наш проект растет, и мы ищем нового члена нашей дружной команды - специалиста по Data Science с опытом в NLP.
Основные задачи:
- Анализ и обработка больших объемов неструктурированных или слабоструктурированных медицинских текстовых данных;
- Разработка и реализация алгоритмов для классификации, кластеризации и извлечения полезной информации из медицинских текстов;
- Создание NLP-моделей для обработки естественного языка;
- Сотрудничество с командой разработчиков для интеграции разработанных моделей в конечные продукты;
- Участие в полном цикле ML-разработки от исследования до внедрения и мониторинга;
- Взаимодействие с медицинскими экспертами для улучшения качества и релевантности результатов обработки информации;
- Генерация гипотез и поиск точек роста продуктов на основе данных историй взаимодействия с пользователями;
- Разработка новых подходов и процессов разметки данных для оценки качества работы моделей;
- Оптимизация пайплайна исполнения на CPU/GPU инфраструктуре.
Требования: - Хорошие знания Python и умение писать понятный, качественный, чистый код;
- Опыт работы над NLP-задачами от двух лет;
- Глубокие знания в области машинного обучения и анализа текстов, включая опыт работы с библиотеками NLP (NLTK, SpaCy, Gensim, pyonmttok и пр.);
- Знание классических методов: tf-idf, Skip-gram, CBoW, CRF, FSTs, HMM;
- Опыт работы с MLFlow, Docker, Streamlit, FastAPI, TensorFlow, традиционным DS-стеком (numpy, pandas, matplotlib, sklearn);
- Опыт работы с git;
- Опыт доведения ML моделей до продакшн стадии;
- Умение работать с большими объемами данных, разработка оптимальных алгоритмов для эффективной обработки.
- Высшее образование в области компьютерных наук, прикладной математики, статистики или в смежных областях;
Будет плюсом:
- Опыт в области анализа медицинских текстов или работы над проектами в области здравоохранения;
- Опыт запуска пилотных проектов и проведения А/В тестов;
- Опыт работы с SQL;
- Опыт работы с инструментами разработки и CI/CD;
- Знание современных архитектур и моделей — рекуррентные и свёрточные сети, современные языковые модели (BERT, BART, Т5 и т.п.), LLM (+ методов их тюнинга RAG, RLHF, LoRa).
Условия:
Если вы хотите участвовать в амбициозных, социально значимых проектах по разработке и внедрению IT решений присоединяйтесь к нашей профессиональной команде!