Оплата не указана
Требуемый опыт работы
От 1 года до 3 лет
Тип занятости
Полная занятость
График работы
Полный день
Обязанности:
- Работа с текстовыми данными в юридическом домене.
- Подготовка интерфейсов разметчика и верификатора на платформе краудсорсинг разметки данных TagMe на основе html/javascript.
- Загрузка и выгрузка данных для различных источников.
- Фильтрация и дедупликация текстовых данных.
- Написание скриптов сравнения и матчинга текстовых данных.
- В работе потребуется терпение, внимательность и способность к рутинным проектам.
Требования:
– Основы html, css
– Основы JavaScript (базовый браузерный JavaScript для валидации данных форм, обработки данных - числа, строки, if-else, циклы, работа с JSON, csv, данными форм)
– Основы мат. статистики для проектирования и расчета размера перекрытий
– Python для обработки выгруженных данных
– Pandas, SQL - для формирования датасетов, выгрузки данных из структурированных источников, аналитики данных
– Знание основных nlp-метрик (точность, полнота, BLEU, ROUGE, BERT-score и др.)
Желательно:
- Опыт работы с платформами разметки/краудсорсинга - Толока, TagMe и др.
- Опыт проектов подготовки текстовых данных
- Знание методологии анализа данных, методологии обучения ML моделей - train/test/validation.
- Знание методологии построения статистических выборок (стратифицированные выборки, контроль распределений данных).
Условия:
- Стабильный оклад и социальная поддержка сотрудников;
- Официальное оформление;
- Расширенный ДМС и льготное страхование для близких;
- Корпоративное обучение в Виртуальной школе Сбера;
- Бесплатная подписка СберПрайм+ и скидки на продукты компаний-партнеров;
Контактная информация
СберПраво
Сайт: sberpravo.ru
Почта: не указана
Вакансия опубликована 14.03.2025 в г. Москва.
Похожие вакансии
Не указана
Москва
Удаленная работа
Подробное описание
20 февраля
Не указана
Москва
Полный день
Подробное описание
24 февраля