하둡과 Yarn 및 클러스터에 관해 구글링을 하던 중 유용한 wikidocs가 있어서 리뷰를 진행하였습니다.
해당 wikidocs의 주소는 아래와 같습니다.
https://wikidocs.net/book/2203
- 빅데이터에 수집, 정제, 적재, 분석, 시각화의 여러 단계에 관해서 관련 프레임워크나 오픈소스를 잘 설명하고 있으며 하둡과 Yarn에 대해 많은 정보를 얻어서 유익하였습니다.
- 빅데이터 에코시스템에 관해서 관련 기술과 특징들에 대해 전반적인 구조를 알 수 있으며 하둡과 하이브에 대한 다양한 예제 및 아키텍처들을 설명하고 있어서 빅데이터 시스템을 이해하는데 도움이 많이 되었습니다. 또한 빅데이터 시스템을 이용하는 회사의 아키텍처와 클러스터 운영시 관련 에러를 예시를 들어 설명을 하고 있어서 간접경험을 하는데 큰 도움이 되었습니다.
- 하둡과 하이브에 대해 자세히 설명을 해주고 정리가 잘 되어있어서 이해하는데 좋았다. 또한 관련 사례 및 예제를 통해서 조금 더 친밀하게 경험을 할 수 있었다.
- 데이터 엔지니어 업무를 하고있거나 빅데이터 아키텍처에 관심이 많은 분이라면 기본 개념을 탄탄하게 잡을 수 있도록 도움이 될 것입니다.
'책 리뷰' 카테고리의 다른 글
파이썬 알고리즘 인터뷰 - 박상길 (0) | 2022.03.20 |
---|---|
[wikidocs] 빅데이터 - 스칼라,스파크로 시작하기 (0) | 2022.03.08 |
아마존 웹 서비스 AWS Discovery Book - 권영환 (1) | 2022.02.09 |
완벽한 IT 인프라 구축을 위한 Docker - Asa Shiho (0) | 2022.01.27 |
스파크를 다루는 기술 - 페타제제비치 (0) | 2022.01.20 |