융무의 기술블로그
article thumbnail

스파크에 대해 공부를 하던 중에 전체적인 구성에 대해 잘 정리된 위키북스가 있어서 서평을 쓰게 되었습니다.

https://wikidocs.net/book/2350

 

빅데이터 - 스칼라(scala), 스파크(spark)로 시작하기

현재 빅데이터 분석기술 중에서 가장 주목 받는 기술은 아파치 스파크(spark)입니다. **스파크**는 인메모리(In-Memory) 기반의 처리로 하둡의 맵리듀스에 ...

wikidocs.net

  • 스파크를 이용하여 ELT 및 튜닝을 하면서 스파크에 대한 공부를 하기 위해서 책을 읽게 되었다. 이 책은 스칼라와 스파크에 대한 개념을 체계적으로 설명하고 있으며 코드를 활용한 예시를 통해서 경험할 수 있다는게 매력적이였다.
  • 하둡 에코시스템 중 스칼라, 스파크에 대한 개념에 대해 정리가 필요하신분에게 추천하며 스칼라와 스파크의 구조에 대해서 정리하며 기본기를 튼튼히 다듬었습니다.
  • 책을 읽고 나서 현재 업무 하고 있는 하둡 에코시스템의 시스템 설정값에 대해 다시 하번 보게되면서 개선 포인트나 튜닝 포인트에 대해 생각을 하게 되었습니다. 스칼라와 스파크의 전체적인 구성을 익히기에 좋았습니다.
profile

융무의 기술블로그

@융무

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!