Вместе с масштабным развитием IT-направления, Wildberries строит культуру Trust and Safety, гарантируя непрерывную безопасность и доверие между компанией, её сотрудниками, пользователями и клиентами.
Мы — команда, работающая над созданием интеллектуальной платформы видеоаналитики.
Наше решение помогает распознавать события, считывать поведение и обеспечивать безопасность на множестве объектов. Платформа должна работать надёжно, несмотря на проблемы нестабильности сети, железо «в поле» и высокую нагрузку.
Мы ищем опытного DevOps-инженера, который станет частью ядра команды и поможет обеспечить стабильную, масштабируемую и автоматизированную инфраструктуру для быстро развивающейся системы, выходящей за рамки "типового продакшена".
Задачи:
Разворачивать и администрировать инфраструктуру платформы на различных объектах (on-prem / edge-серверы, частично — облака)
Настроить и поддерживать CI/CD пайплайны, мониторинг, резервное копирование и восстановление.
Работать с контейнерами и оркестрацией на базе Kubernetes.
Автоматизировать развёртывание на новые объекты: минимизировать ручной труд, внедрить лучшие практики IAC (Infrastructure as Code).
Работать с высоконагруженными серверами (видеопотоки, ИИ-модули), учитывать особенности ресурсов: CPU/GPU, дисковая подсистема, сети.
Участвовать в выборе технологий для масштабирования, отказоустойчивости и безопасности.
Для этого нужно:
От трех лет опыта в роли DevOps/Site Reliability Engineer.
Уверенно работать с Linux, Docker, Kubernetes, Ansible/Terraform.
Иметь опыт построения CI/CD (GitLab CI, Jenkins или аналогичные).
Знать, как проектировать отказоустойчивую инфраструктуру.
Понимать архитектуру нагруженных систем и уметь работать с логами, мониторингом и алертингом (Prometheus, Grafana, ELK и т.п.).
Мы предлагаем: