Больше информации по резюме будет доступно после регистрации
ЗарегистрироватьсяБыла сегодня в 17:25
Женщина, 24 года, родилась 31 октября 2001
Алматы, готова работать удалённо: Ташкент, Тбилиси, готова к редким командировкам
Data Engineer / ETL - Developer
Специализации:
- Аналитик
- Программист, разработчик
Тип занятости: полная занятость, частичная занятость, проектная работа/разовое задание
Опыт работы 5 лет
Июль 2025 — по настоящее время
10 месяцев
Developer Data Engineer
- Проведение миграции данных большого объёма из Oracle в целевое хранилище Y-Matrix, включая анализ структуры, подготовку схем и контроль корректности переноса
- Участие в проектировании и реализации архитектуры нового хранилища данных
- Создание внутреннего фреймворка для стандартизации загрузки, трансформации и валидации данных в новом DWH
- Разработка процессов синхронизации данных между старым и новым хранилищем
- Организация поэтапной миграции с обеспечением консистентности, полноты и историчности данных
- Массовая генерация таблиц в новом хранилище с сохранением структуры и логики старой модели данных
- Описание и поддержка концептуальной и логической модели данных
- Разработка механизмов контроля качества данных (Data Quality) после переноса
- Реализация автоматизированных проверок целостности, полноты и корректности данных
- Разработка процесса выявления аномалий после формирования таблиц детального слоя (DWH Detail Layer)
- Тестирование ETL-процессов, нагрузочное тестирование и контроль производительности
- Настройка и оптимизация DAG’ов в Airflow
- Реализация data-driven зависимостей (Dataset scheduling / триггеры / сенсоры)
- Мониторинг SLA, статусов задач и инфраструктуры через Grafana
- Настройка оповещения при сбоях загрузки данных
Апрель 2024 — Май 2025
1 год 2 месяца
Частная компания Qala AI Ltd
Информационные технологии, системная интеграция, интернет... Показать еще
Data engineer
- Участвовала в разработке и поддержке ETL-процессов под ключ, с учётом требований заказчиков и технических регламентов
- Разрабатывала выгрузки и автоматические отчёты для страховых компаний с использованием Python (pandas, openpyxl), формировала Excel-отчёты по заданной структуре и фильтрам
- Выполняла очистку, нормализацию и валидацию больших объёмов данных перед загрузкой в хранилище
- Работала с геоданными (точки, полигоны, мультиполигоны) в рамках проекта «Умный город»:
- обрабатывала пространственные данные,
- взаимодействовала с GeoPandas, Shapely, Folium,
- участвовала в анализе пространственной доступности объектов и населённых пунктов
- Проектировала DAG'и в Apache Airflow, настраивала зависимости и графики выполнения
- Интегрировала и трансформировала данные из внешних источников (XML, JSON, REST API)
- Работала с БД: PostgreSQL (включая PostGIS), ClickHouse, Oracle, Vertica, Impala
- Сотрудничала с командами аналитиков и инженеров для обеспечения стабильной поставки и трансформации данных под бизнес-задачи
- Обеспечивала контроль качества данных и сопровождение пайплайнов в продакшене
Ноябрь 2023 — Апрель 2024
6 месяцев
Казахстан, www.kaspibank.kz
Финансовый сектор... Показать еще
Data engineer
Работала с DWH корпоративного уровня: извлекала, агрегировала и структурировала данные для внутренних отчётов и внешних аналитических систем
Оптимизировала SQL-запросы: добавление индексов, партиционирование, рефакторинг CTE, оконных функций
Участвовала в сопровождении бизнес-критичных ETL-джобов, обеспечивая стабильность выполнения и контроль качества данных
Внедрила скрипты автоматической валидации агрегатов и расхождений в отчетах, что снизило количество ручных проверок
Сотрудничала с бизнес-аналитиками для трансляции требований в эффективные архитектурные решения
Апрель 2021 — Ноябрь 2023
2 года 8 месяцев
АО КазМунайГаз
Алматы
Информационные технологии, системная интеграция, интернет... Показать еще
Специалист сектора BigData
Разработала пайплайн автоматической миграции и синхронизации данных между несколькими PostgreSQL-окружениями (prod/test/dev)
Создала витрины данных на базе Spark SQL для аналитических дашбордов, сократив время извлечения данных в 3 раза
Настраивала Apache Airflow: DAG’и, скоординированные под зависимости между задачами и повторными запусками
Работала с Liquibase для контроля версий схем баз данных в рамках CI/CD процессов (GitLab CI)
Внедрила мониторинг пайплайнов через Druid, повысив оперативность реагирования на сбои
Вела документацию, ставила задачи и контролировала прогресс в YouTrack
Навыки
Уровни владения навыками
Продвинутый уровень
Средний уровень
Уровень не указан
Опыт вождения
Права категории A
Обо мне
Data Engineer с 4+ годами опыта в построении надёжных ETL-процессов, разработке data pipeline’ов, оптимизации SQL-запросов и парсинге сложных форматов (XML, JSON). Имею практический опыт работы с несколькими СУБД (PostgreSQL, ClickHouse, Oracle, Vertica, Impala), уверенно использую Python, Airflow, Spark и другие инструменты. Работала как в корпоративных DWH, так и со стримингом и витринами. Готова брать ответственность, работаю по Agile, быстро осваиваю новые технологии.
Высшее образование
2024
Высшее образование
Школа информационных технологий и инженерии, Software engineering
2022
Высшее образование
Satbayev University
Программная инженерия, Информатика и вычислительная техника
Знание языков
Гражданство, время в пути до работы
Гражданство: Казахстан
Разрешение на работу: Казахстан
Желательное время в пути до работы: Не имеет значения