융무의 기술블로그
article thumbnail

Hive와 Presto 쿼리 엔진을 이용하여 데이터 플랫폼에서 ELT를 담당하고 있습니다. 하둡 완벽 가이드에서 하이브에 대해 간략하게 봤지만 운영하면서 궁금했던 점이나 하이브의 쿼리 처리를 하는 데 있어서 디테일하게 보고자 이 책을 선택하게 되었습니다. 책의 목차를 봤을 때 배울 점이 많을 거 같다는 생각과 함께 선배가 하이브 책 중에서 이 책을 추천해서 절판 상태였지만 중고서적으로 겨우 구해서 읽었습니다. 하이브뿐만 아니라 하둡의 생태계까지 재밌게 읽으면서 봤습니다.

- 이 책은 데이터 모델링부터 쿼리, 색인, 튜닝, 함수, 스토리지 핸들러, HCatalog 등의 고급 기능까지 총망라하여 제공하고 있습니다.
- 이 책의 목적은 개발자, 데이터베이스 관리자, 아키텍트는 물론이고 비즈니스 분석가처럼 기술 수준이 낮은 사용자에게 이르는 모든 이에게 HiveQL을 예제 중심으로 설명하는 것, 개발자나 하이브 쿼리의 성능 튜닝 및 사용자 정의 함수, 커스텀 데이터 포맷 정의를 사용할 하둡 관리자에게 필요한 기술적 내용을 자세히 제공하고 있습니다.
- 책은 하이브 설치부터 소스 코드를 가지고 실습을 할 수 있게 제공하고 있습니다. 비록 2013년 이후로 개정판이 따로 출판되어있지 않지만 하이브를 실무로 사용하시는 분들이 읽으면 많은 부분을 배울 수 있어서 추천드리고 싶습니다.

profile

융무의 기술블로그

@융무

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!