Для открытия контактов резюме необходимо приобрести доступ к базе
Не указана
Гражданство
Россия
Тип занятости
Полная занятость, Частичная занятость
Мужчина, 28 лет, родился 27 января 1996
Город: Санкт-Петербург
Опыт работы
11 лет 3 месяца
iconicchain
ML Team Lead
С 01.06.2023 по настоящее время (1 год 7 месяцев)
Руковожу разработкой нового пайплайна на основе LLM для извлечения структурированных данных из финансовых документов. Совмещаю инженерные и менеджерские навыки для быстрой и эффективной реализации проекта в соответствии с требованиями клиентов: - Создал принципиально новое решения для парсинга документов на базе локальных LLM (Python, LangChain, llama_cpp, TorchServe). Данный подход стал ключевым для привлечения новых клиентов из большой четверки (KPMG, EY) - Спроектировал RAG-пайплайн для проверки соответствия между рабочими контрактами и законодательством (LangChain/LlamaIndex, llama_cpp для локального инференса) - Файн-тюнил LLM на данных компании (mistral, llama, gemma) - Разработал бенчмарки и руководил проведением экспериментов для оценки качества моделей - Участвовал во встречах с заказчиками как технический эксперт - Дизайнил будущее развитие продукта, конвертировал бизнес-требования в технические таски для команды - Менторил команду, помог 2 junior DS вырасти в middle/middle+ - Собеседовал кандидатов на ML позиции
iconicchain
ML Team Lead
С 01.06.2023 по настоящее время (1 год 7 месяцев)
Руковожу разработкой нового пайплайна на основе LLM для извлечения структурированных данных из финансовых документов. Совмещаю инженерные и менеджерские навыки для быстрой и эффективной реализации проекта в соответствии с требованиями клиентов: - Создал принципиально новое решения для парсинга документов на базе локальных LLM (Python, LangChain, llama_cpp, TorchServe). Данный подход стал ключевым для привлечения новых клиентов из большой четверки (KPMG, EY) - Спроектировал RAG-пайплайн для проверки соответствия между рабочими контрактами и законодательством (LangChain/LlamaIndex, llama_cpp для локального инференса) - Файн-тюнил LLM на данных компании (mistral, llama, gemma) - Разработал бенчмарки и руководил проведением экспериментов для оценки качества моделей - Участвовал во встречах с заказчиками как технический эксперт - Дизайнил будущее развитие продукта, конвертировал бизнес-требования в технические таски для команды - Менторил команду, помог 2 junior DS вырасти в middle/middle+ - Собеседовал кандидатов на ML позиции
iconicchain
Senior Machine Learning Software Specialist
С 01.11.2022 по 01.06.2023 (7 месяцев)
Разрабатывал, имплементировал и внедрял в прод CV и object-detection модели для Document AI: - Создал новый пайплайн для детектирования и парсинга таблиц в финансовых документах - Имплементировал кастомный CV пайплайн (10+ моделей) для извлечения структурированных данных из документов. Это значительно увеличило гибкость инструмента и качество парсинга - Оптимизировал модели (поддержка ГПУ, ONNX, бенчмарки для контроля качества, batch inference, и т.д.)
Quantum Brains
ML Developer, Researcher
С 01.09.2020 по 01.11.2022 (2 года 2 месяца)
- Создание предиктивных нейронных сетей с кастомной архитектурой. Полный цикл от Jupyter notebook до внедрения на прод (PyTorch) - Создание вспомогательного сервиса для регулярного контроля качества торговли с интеграцией в Slack (Python, shell, InfluxDB). - Quantitative research (тестирование математических моделей, проверка гипотез) - Участие в организации еженедельных ML-митапов для разбора статей и расшаривания знаний между коллегами
Deeplight Ventures
Разработчик-консультант, part-time
С 01.10.2020 по 01.08.2021 (10 месяцев)
- Создание вероятностной модели отказов оборудования с использованием Байесовских сетей доверия (Naïve Bayes, PyMC, GeNIe Academic) - Создание алгоритма для заполнения пропусков в данных на базе KNN (метод k ближайших соседей) - Консультации по связке нефтяного инжиниринга + ML, построение экспериментов, позволяющих оценить качество и применимость модели - Статистический анализ имеющегося набора данных - Отбор признаков для модели - Подготовка презентационных материалов для потенциальных заказчиков
Газпром нефть, ПАО
Data Scientist (Ведущий специалист)
С 01.09.2018 по 01.10.2020 (2 года 1 месяц)
- Реализация проекта по созданию модели для пересчета добычи нефти через параметры работы насоса ("Виртуальный расходомер", "VFM") - Участие во внедрении Виртуального расходомера на 5 месторождениях компании в качестве Product Owner’а и методолога - Анализ неструктурированных промысловых данных с месторождений - Математическое моделирование погружного оборудования - Создание скриптов для обработки, визуализации, группировки по времени и анализа неструктурированного набора данных (Python) - Применение алгоритмов машинного обучения для предсказания одного из параметров работы скважины как PoC для VFM (Python) - Участие в проекте по созданию статистического алгоритма для контроля и определения аномальных значений замеров во временном ряде для помощи оператору на месторождении
Лаборатория фундаментальных основ ледотехнических исследований
Младший научный сотрудник, part-time
С 01.03.2020 по 01.09.2020 (6 месяцев)
- Реализация вероятностной модели взаимодействия льда с поверхностями с использованием скрытых марковских моделей - Подбор параметров моделируемых процессов (с использованием методов оптимизации) - Создание модели роста пятна контакта лед-твердое тело - Статистическая обработка и анализ цифровых сигналов
АО "Навис"
Младший инженер
С 01.09.2016 по 01.08.2018 (1 год 11 месяцев)
- Создание модели троса в воде под действием течения и конструкции системы для моделирования датчика определения относительного местоположения судна (Taut Wire) - Математическое моделирование системы Taut Wire, построение экспериментов - Отладка и проверка систем управления движением судна
Образование
Университет
Санкт-Петербургский государственный политехнический университет
Университет
Санкт-Петербургский государственный политехнический университет
Владение языками
Родной язык
Русский
Иностранные языки
Английский
Дополнительно
Ключевые навыки
Английский язык
Знаком с python
Research and market data analysis
mathematical modeling
mathematical programming
mathematical statistics
Владение pandas, numpy, scikit-learn, pytorch
machine learning
torchserve
Навыки работы с docker/docker-compose
Знание git
langchain
llama-cpp
computer vision
Опыт работы с nlp, знание стека от tf-idfдо llm
Ps, ai
rag
руководство командой разработчиков
Дополнительная информация
Data Scientist с опытом работы в финтехе и нефтегазовой индустрии. Активно применяю знания математики, машинного обучения и программирования для эффективного решения бизнес-задач. В настоящее время руковожу ML командой, разрабатывающей решения для увеличения эффективности аудита (CV + NLP). Предложенное решение для парсинга документов на базе LLM стало ключевой фичей проекта и позволило привлечь клиентов из большой аудиторской четверки (KPMG и EY). Свободно владею разговорным и техническим английским, есть опыт работы в международной компании. Выступал на международных конференциях (APM 2018, SPE Moscow 2019, SPE Symposium Oman, Muscat, 2020). Ссылки на работы: Виртуальный расходомер: https://www.researchgate.net/publication/336156286_Efficiency_Analysis_of_ESP_Lifted_Wells_in_the_Context_of_Virtual_Flow_Metering_Russian Computer-Vision решение для обработки документов: https://iconicchain.com/extracting-data-from-financial-documents-with-ai/ LLM для увеличения эффективности аудита: https://iconicchain.com/ai-and-the-auditor-a-new-era-for-financial-document-analysis/ Сфера интересов: data science, AI, CV, NLP (+ LLMs) машинное обучение, математическое моделирование. Профессиональные навыки: Руководство командой data scientist-ов Создание и интеграция в прод ML-пайплайнов для решения бизнес-задач (timeseries + CV + NLP) Опыт в качестве Product Owner Создание прототипов алгоритмов на языке Python и их дальнейшее внедрение в прод Использование библиотек Python для анализа и визуализации данных (NumPy, Pandas, SciPy, Sklearn, PyTorch, Matplotlib, Plotly) Применение статистических методов для анализа временных рядов Поиск неявных взаимосвязей между параметрами в наборах данных Решение задач регрессии, классификации, распознавания объектов, поиска похожих объектов, генерации текста Вероятностное моделирование процессов, применение HMM (скрытые марковские модели) Инженерные программы для моделирования (ANSYS Workbench, ABAQUS CAE) Пакеты программ для научных исследований (Matlab/Wolfram Mathematica/Maple)
Похожие резюме
до 150 000 ₽
35 лет
Санкт-Петербург
Полный день
Последнее место работы
АО "Теплосеть Санкт-Петербурга", Инженер-технолог 1-й категории, август 2013 - сентябрь 2021
Обновлено
17.10 в 12:03
Был на сайте
Более недели назад
Опыт работы
12 лет 9 месяцев
до 70 000 ₽
24 года
Санкт-Петербург
Полный день, Гибкий график, Удаленная работа
Последнее место работы
Ростелеком, Инженер электросвязи, сентябрь 2020 - сентябрь 2021
Обновлено
19.11 в 15:26
Был на сайте
Более недели назад
Опыт работы
4 года 10 месяцев
до 80 000 ₽
38 лет
Санкт-Петербург
Полный день, Гибкий график, Удаленная работа
Последнее место работы
ФГУП "НТЦ "Эксперт", Секретарь, июль 2006 - август 2008
Обновлено
18.10 в 04:17
Был на сайте
Более недели назад
Опыт работы
22 года 6 месяцев