Анна Морозова
- Телефон: +7 903 123 45 67
- Эл. почта: anna.morozova@email.com
- Местоположение: Москва, Россия
- LinkedIn: anna-morozova-dw
Резюме
7-летний опыт проектирования, разработки и оптимизации высокопроизводительных хранилищ данных, обеспечивающих критически важную бизнес-аналитику. Успешно реализовала более 10 проектов по интеграции данных, сократив время обработки на 30% и повысив точность отчетности на 25%. Глубокие знания SQL, Python, Apache Airflow и платформ облачных хранилищ данных.
Опыт работы
Ведущий специалист по хранилищам данных, Банк Открытие -- Москва, Россия
Март 2020 – настоящее время
-
Разработала и внедрила новую архитектуру хранилища данных на базе Greenplum, что позволило сократить время генерации отчетов на 40% для ключевых бизнес-процессов.
-
Руководила командой из 3 ETL-разработчиков, обеспечивая своевременное выполнение проектов и соблюдение стандартов качества данных.
-
Оптимизировала существующие ETL-процессы, используя Apache Airflow, что привело к снижению ошибок загрузки данных на 20% и повышению стабильности системы.
-
Внедрила систему мониторинга качества данных, выявляя и устраняя несоответствия данных до их использования в аналитике.
Специалист по хранилищам данных, Ростелеком -- Москва, Россия
Сентябрь 2016 – Февраль 2020
-
Участвовала в разработке и сопровождении корпоративного хранилища данных на базе Oracle Exadata.
-
Создавала и оптимизировала сложные SQL-запросы и хранимые процедуры для извлечения и преобразования данных.
-
Разработала автоматизированные скрипты на Python для валидации данных и мониторинга производительности ETL-заданий.
-
Взаимодействовала с бизнес-аналитиками для сбора требований и проектирования витрин данных.
Образование
Московский государственный технический университет имени Н.Э. Баумана (МГТУ им. Н.Э. Баумана), Магистр в Информатика и вычислительная техника -- Москва, Россия
Сентябрь 2014 – Июль 2016
Московский государственный технический университет имени Н.Э. Баумана (МГТУ им. Н.Э. Баумана), Бакалавр в Прикладная математика и информатика -- Москва, Россия
Сентябрь 2010 – Июль 2014
Навыки
Базы данных и хранилища данных: Greenplum, Oracle Exadata, PostgreSQL, MS SQL Server, Teradata, ClickHouse, Apache Cassandra, Snowflake
ETL/ELT Инструменты: Apache Airflow, Informatica PowerCenter, Talend, SSIS, Python (Pandas, SQLAlchemy)
Языки программирования и скрипты: SQL (ANSI, PL/SQL, T-SQL), Python, Bash
Облачные платформы: Google Cloud Platform (BigQuery, Dataflow), AWS (Redshift, Glue), Yandex.Cloud
Инструменты отчетности и аналитики: Tableau, Power BI, Qlik Sense, Apache Superset
Методологии и концепции: DWH Inmon/Kimball, Data Vault 2.0, Data Governance, Data Quality, CI/CD, Git