Старший Data Scientist, RND проекты поиска / JobVK

Старший Data Scientist, RND проекты поиска

Ozon

Полная занятость

Привет! Это команда Research-проектов поиска Ozon

Мы работаем над инновационными DS-задачами, которые напрямую влияют на качество поисковой выдачи и пользовательский опыт миллионов клиентов. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления.

Мы решаем сложные и интересные задачи на стыке машинного обучения, аналитики и бизнеса, вот пример основных проектов на ближайший период:

Разработка системы агрегации статистики по "реальным" товарам — создаем интеллектуальные алгоритмы для сбора и анализа данных, которые становятся ключевыми фичами в основной модели ранжирования поиска Ozon.
Аналитика продвижения новых товаров — применяем Look-alike моделирование для прогнозирования успешности новинок и выявления факторов, влияющих на их продвижение.
Построение системы поиска товаров-конкурентов — разрабатываем алгоритмы кластеризации для формирования групп схожих конкурирующих товаров, что помогает улучшать релевантность поисковой выдачи.

Сейчас мы ищем старшего Data Scientist.

Почему стоит присоединиться к нам:

Проекты с реальным impact — ваша работа будет напрямую влиять на алгоритм ранжирования и, как следствие, на ключевые метрики бизнеса и пользовательский опыт.
Глубокое погружение в сложные задачи — никакой операционки, только интересные проекты, требующие глубокой экспертизы и творческого подхода.
Сильная команда и развитая инфраструктура — работа с опытными коллегами в условиях современной технологической экосистемы, где можно быстро внедрять решения в PROD и наблюдать результаты своей работы.

Наш стек:

Python, PySpark, ClickHouse, Airflow, MLflow, DVC.

Вы будете:

Разрабатывать и внедрять ML-модели для решения задач агрегации статистики по товарам, анализа новинок и поиска конкурентов.
Работать с данными на всех этапах: от исследования до автоматизации пайплайнов расчета датасетов на PySpark.
Подбирать ML-решения для бизнес-задач, планировать и проводить офлайн и онлайн-эксперименты (А/Б тесты).

Нам важно:

Опыт работы в Data Science от 3х лет.
Глубокие знания теории вероятностей и машинного обучения.
Сильные навыки Python.
Опыт работы с Hadoop-стеком и большими данными.