Проектирование и построение масштабируемых хранилищ данных;
Настройка ETL/ELT-пайпланов для обработки и трансформации данных;
Автоматизация процессов загрузки, очистки и агрегирования данных;
Внедрение процессов валидации и версионирования данных;
Улучшение скорости эффективности обработки больших объемов данных;
Оптимизация запросов к базам данных и аналитическим системам;
Настройка механизмов кеширования и индексации данных;
Разработка API и интерфейсов для удобного доступа к данным;
Ведение документации по структуре данных, ETL-процессам и стандартам работы.
Требования:
Высшее образование в области информационных технологий/техническое;
Релевантный опыт работы от 2 лет;
Английский язык уровня В2;
Навыки разработки на последних версиях языка Python (3.8+);
Уверенное знание библиотек pandas, numpy;
Понимание процессов ETL;
Глубокое понимание реляционных баз данных (PostgreSQL, MySQL, MS SQL, SAP HANA) и NoSQL (MongoDB, Cassandra, Redis). Продвинутые навыки работы с ORM (включая миграции);
Понимание принципов работы docker и docker-compose, умение писать простые файлы конфигурации для этих сервисов (Dockerfile/docker-compose.yml)
Базовые навыки работы с командной строкой (включая работу через SSH).
Условия:
Официальное оформление в соответствии с ТК РФ;
Конкурентоспособная заработная плата;
Полностью "белый" доход;
Дополнительное медицинское страхование (ДМС) со стоматологией;
Бесплатные завтраки в офисе;
Возможность повышать уровень профессиональных компетенций в рамках Корпоративного университета;
Корпоративное такси;
Работу в сильной команде профессионалов в Компании - Лидере отрасли.