- 이 책은 Apache Airflow의 개념과 적용 방법에 대한 설명뿐만 아니라, 실제 서비스 운영 시 고려해야 할 모니터링, 확장, 보안 등에 관한 내용에 관한 내용을 상세하게 안내하고 있으며 , 다양한 클라우드 환경에서 활용하는 방법까지 다루고 있습니다. 또한 Airflow 설치부터 파이프라인 작성, 테스트, 분석, 백필 그리고 배포 실습까지 한 번에 해결할 수 있어 많은 도움이 되었습니다.
- 책에서는 전반전익 Airflow에 대해 설명하고 있으며 기초, 중급, 실습으로3단계에 나눠서 소개하고 있습니다. 특히 클라우드에서 Airflow 관리에 대해서 AWS, GCP, Azure에 대해서 실습을 통해 더 자세하게 알 수 있었으며 운영하고 있는 Airflow에 대해서 시스템적으로 돌아보게 되는 계기가 되었습니다.
- Airflow의 공식 홈페이지 문서에도 자세하게 설명을 하고 있지만 번역본으로 한번 전체적인 구조를 파악한 다음에 공부를 해도 좋을 거 같습니다. 효율적인 파이프라인의 구축이 중요하다는 것과 Airflow를 활용하여 파이프라인 스케줄링을 할 때 고려해야 할 부분에 대해서 많이 배우게 되었습니다. 또한 효율적이고 유지보수 가능한 파이프라인을 구축하기 위한 몇 가지 사례를 통해서 경험을 할 수 있어서 좋았습니다.
- Airflow 아키텍처에 대해서 더 자세하게 알게 되어서 좋았으며 익스큐터 유형에 따라 세부적인 내용에 대해 알 수 있게되어서 좋았습니다. SequentialExecutor, LocalExecutor, CeleryExecutor, KubernetesExecutor의 특징과 설정에 대해 배우며 운영환경에서 Airflow 관리에 대해 배웠습니다. 관련하여 효율적인 DAG를 작성하는 데 있어서 모범 사례를 들어서 구축할 때 고려해야 할 부분에 대해서 배워서 좋았습니다.
'책 리뷰' 카테고리의 다른 글
데이터 파이프라인 핵심 가이드 - 제임스 댄스모어 (0) | 2022.08.01 |
---|---|
내가 같이 뛰어내려 줄게 - 씨씨코 (0) | 2022.07.26 |
실무로 배우는 빅데이터 기술 - 김강원 (0) | 2022.05.11 |
스파크 완벽 가이드 - 빌 체임버스, 마테이 자하리아 (0) | 2022.05.03 |
데이터 중심 애플리케이션 설계 - 마틴 클레프만 (1) | 2022.03.30 |