Поиск работы на сайте Jobvk.com
Разместить вакансию
Разместить резюме

Старший Data Scientist, RND проекты поиска

Ozon
  • Полная занятость

Привет! Это команда Research-проектов поиска Ozon

Мы работаем над инновационными DS-задачами, которые напрямую влияют на качество поисковой выдачи и пользовательский опыт миллионов клиентов. Направление поиска возглавляет Игорь Кураленок, в прошлом руководитель отдела оценки качества поиска Yandex, R&D лаборатории в Huawei и автор десятков научных пейперов про поиск, ML и распределенные вычисления.

Мы решаем сложные и интересные задачи на стыке машинного обучения, аналитики и бизнеса, вот пример основных проектов на ближайший период:

  • Разработка системы агрегации статистики по "реальным" товарам — создаем интеллектуальные алгоритмы для сбора и анализа данных, которые становятся ключевыми фичами в основной модели ранжирования поиска Ozon.

  • Аналитика продвижения новых товаров — применяем Look-alike моделирование для прогнозирования успешности новинок и выявления факторов, влияющих на их продвижение.

  • Построение системы поиска товаров-конкурентов — разрабатываем алгоритмы кластеризации для формирования групп схожих конкурирующих товаров, что помогает улучшать релевантность поисковой выдачи.

Сейчас мы ищем старшего Data Scientist.

Почему стоит присоединиться к нам:

  • Проекты с реальным impact — ваша работа будет напрямую влиять на алгоритм ранжирования и, как следствие, на ключевые метрики бизнеса и пользовательский опыт.
  • Глубокое погружение в сложные задачи — никакой операционки, только интересные проекты, требующие глубокой экспертизы и творческого подхода.
  • Сильная команда и развитая инфраструктура — работа с опытными коллегами в условиях современной технологической экосистемы, где можно быстро внедрять решения в PROD и наблюдать результаты своей работы.

Наш стек:

  • Python, PySpark, ClickHouse, Airflow, MLflow, DVC.

Вы будете:

  • Разрабатывать и внедрять ML-модели для решения задач агрегации статистики по товарам, анализа новинок и поиска конкурентов.

  • Работать с данными на всех этапах: от исследования до автоматизации пайплайнов расчета датасетов на PySpark.
  • Подбирать ML-решения для бизнес-задач, планировать и проводить офлайн и онлайн-эксперименты (А/Б тесты).

Нам важно:

  • Опыт работы в Data Science от 3х лет.
  • Глубокие знания теории вероятностей и машинного обучения.
  • Сильные навыки Python.
  • Опыт работы с Hadoop-стеком и большими данными.