융무의 기술블로그
article thumbnail
가상 면접 사례로 배우는 머신러닝 시스템 설계 기초 - 알렉스 쉬
책 리뷰 2025. 7. 6. 23:08

이 책은 모델러에서 시스템 빌더로 성장하고 싶은 모든 이들을 위한 책입니다. 머신러닝 프로젝트의 방향을 잡아야 하는 주니어 엔지니어부터, 더 큰 그림을 보고 싶은 시니어 엔지니어, 심지어 머신러닝 기반 제품을 기획하는 PM에게도 많은 도움이 될 거 같습니다.이 책의 가장 큰 장점은 머신러닝 시스템 설계를 일관되고 체계적인 프로세스로 구조화한다는 점입니다. 모든 사례는 요구사항 명확화 → 문제 구조화 → 데이터 준비 → 모델 개발 → 평가 → 서빙 및 모니터링이라는 명확한 파이프라인을 따라 진행됩니다. 독자는 이 흐름을 반복적으로 따라가며, 복잡하게만 보였던 머신러닝 시스템 설계의 전체 그림을 자연스럽게 머릿속에 그리게 되는 거 같습니다. 1. End-to-End 파이프라인 설계 능력이 책은 모델의 정확도..

article thumbnail
가상 면접 사례로 배우는 대규모 시스템 설계 기초 2 - 알렉스 쉬
카테고리 없음 2025. 5. 25. 23:08

대규모 시스템 설계는 단순히 트래픽을 처리하는 수준을 넘어서, 비기능 요구사항과 실시간성, 확장성, 장애 대응까지 고려해야 하는 복잡한 작업입니다. 『가상 면접 사례로 배우는 대규모 시스템 설계 기초 2』는 이러한 현실적인 문제들을 구체적인 서비스 사례를 통해 설명하며, 실무자에게 실질적인 통찰을 제공합니다. 특히 데이터 엔지니어링 관점에서 매우 유익한 책입니다.실무에 바로 적용 가능한 설계 사례책에서 다루는 각 장은 가상의 면접 질문을 기반으로 실전 설계 프로세스를 단계별로 풀어가는 방식으로 구성되어 있습니다. 단순히 이론적인 설명을 넘어서, 현실적인 제약 조건과 기술 선택 간의 트레이드오프를 함께 보여줍니다.예를 들어, 근접성 기반 서비스나 주변 친구 찾기 기능을 설계하는 장에서는 다음과 같은 내용을..

article thumbnail
AWS 비용 최적화 바이블 - 엘리 만수르
책 리뷰 2025. 3. 17. 00:07

이 책은 클라우드의 새로운 사용량 기반 요금제와 소비 모델이 가져온 비용 관리의 복잡성을 해결하기 위한 필독서입니다.과거에는 EC2의 CPU를 얼마나 많이 쓰는가가 성능의 척도였다면, 이제는 서버리스로 얼마나 저렴하고 빠르게 동일한 결과를 내는가가 핵심 역량이 된 시대적 변화를 명확히 짚어주면서, 저자는 컴퓨팅, 스토리지, 네트워크, 애플리케이션, 운영의 5가지 관점에서 AWS 비용을 체계적으로 분석하며, 독자가 FinOps 전문가처럼 사고하도록 돕습니다.1. 패러다임의 전환: 많이 쓰는 자랑에서 효율적으로 쓰는 자랑으로이 책은 클라우드 시대의 엔지니어링 가치가 어떻게 변했는지 명확히 보여줍니다. 높은 자원 점유율이 아닌, 비용 효율적인 아키텍처(서버리스, 컨테이너 등)로 동일한 비즈니스 가치를 창출하는..

article thumbnail
데이터 엔지니어를 위한 97가지 조언- 토비아스 메이시
책 리뷰 2024. 10. 23. 23:06

이 책은 데이터 엔지니어로서 필요한 지식과 실무적 통찰을 제공하는 97가지 조언을 담고 있습니다. 책에는 데이터 전문가들이 다양하고 구체적인 문제를 극복하면서 얻은 경험과 교훈을 담고 있어서 가볍게 읽기 좋았습니다.주요 내용으로는 일관성과 최종 일관성에 대한 개념, 스토리지 계층의 효율적인 사용, 데이터 파이프라인의 설계 패턴, 그리고 변경 데이터 캡처(CDC)와 메시징 시스템의 중요성입니다. 또한, 데이터 레이크와 데이터 사일로, 데이터 계보 추적 및 관측 가능성의 필요성도 다루고 있으며 실용적이고 확장 가능한 데이터 시스템 구축을 위한 다양한 접근법을 제시하고 있습니다. 데이터 엔지니어링의 이론적 기반부터 실무적 적용까지 폭넓게 다루며, 새로운 기술 트렌드를 가볍게 소개하는 동시에 효율적인 설계 방법..

article thumbnail
데이터 품질의 비밀 - 바 모세스
책 리뷰 2024. 10. 14. 23:29

데이터 엔지니어로 실무를 하면서 연차가 쌓일수록 데이터 신뢰성과 품질에 대해서 많은 중요성을 느끼게 되었고 데이터 카탈로그나 데이터 계보, 데이터 품질 문제 해결, 신뢰성 높은 데이터 시스템을 구축 및 운영에 대해서 인사이트를 얻고자 책을 읽게 되었습니다.데이터 품질의 비밀은 데이터 시스템의 신뢰성 확보와 데이터 품질 관리에 중점을 둔 책입니다. 저자는 데이터 정제와 분석을 넘어서, 신뢰할 수 있는 데이터 시스템을 구축하는 모범 사례와 기술을 소개하며, 데이터 파이프라인에서 다운타임을 방지하고 품질을 유지하는 방법을 강조하고 있습니다.이 책은 데이터 엔지니어와 분석가를 대상으로 하며, 데이터 파이프라인의 복잡성과 다운타임 문제를 해결하는 실용적인 가이드를 제공합니다. 특히 데이터 레이크, 웨어하우스, 레..

article thumbnail
쿠버네티스 모범 사례 - 브렌던 번스
책 리뷰 2024. 2. 25. 21:51

이 책은 CKA 취득 후에 Kubernetes 환경에서 airflow와 trino 그리고 kubeflow를 활용한 MLops 프로젝트를 위해서 사전에 공부를 하게 될 겸 읽게 되었습니다. 책을 읽으면서 예제 코드를 실습할 때 CKAD를 병행하여 재밌게 읽었던 거 같습니다. 이 책은 쿠버네티스에 애플리케이션을 배포하거나 쿠버네티스 기반 애플리케이션에 적용할 수 있는 패턴과 사례를 배우려는 실무자를 대상으로 하고 있습니다. 쿠버네티스를 활용한 애플리케이션 개발, 운영 환경 구축에 필요한 포괄적인 지식을 제공하며 각 패턴별로 모범 사례를 소개하고 있어 실무를 하는데 많은 도움이 될 거 같습니다. 글로벌 애플리케이션 분산: 사용자 경험 향상을 위해 애플리케이션을 글로벌하게 분산 배포하는 전략을 탐구합니다. 레이..

article thumbnail
견고한 데이터 엔지니어링 - 조 라이스
책 리뷰 2023. 12. 13. 23:48

이 책은 빅데이터를 지탱하는 기술, 데이터 파이프라인 핵심 가이드와 더불어 데이터 엔지니어링에 관한 기본서로 많은 내용을 담고 있습니다. 또한, 많은 분들께 추천을 받아 읽게 되었으며 데이터 수명 주기에 관해서 많이 공감하며 재밌게 읽었습니다. 이 책을 읽기 전까지 엔지니어가 결국 기업의 의사결정을 효율적으로 지원하는 역할을 해야 한다고 생각했습니다. 이에 따라 백엔드부터 비즈니스 인텔리전스, 인공지능, 머신러닝, 그리고 MLOps까지 다양한 분야를 고려해야 한다고 생각했습니다. 그러나 이 책을 통해 데이터 엔지니어의 궁극적인 목적과 역할에 대해 새롭게 조명을 받게 되었습니다. 데이터 엔지니어링의 생명주기는 데이터의 생성부터 저장, 수집, 변환, 그리고 서빙까지 이르며, 이 전 과정에 걸쳐 보안, 데이터..

article thumbnail
파이썬 클린코드 2nd Edition - 마리아노 아나야
책 리뷰 2023. 8. 17. 00:04

이 책은 Python 코드 포매팅과 Docstring에 대해서 실무를 하게 될 일이 있어 읽게 되었습니다. 현재는 오픈소스 기여를 하고 있는 데 있어서 많은 도움이 되었습니다. 이 책의 독자는 이미 객체지향 소프트웨어 디자인 원리에 어느 정도 익숙하고 코드를 작성해본 경험이 있는 사람을 대상으로 하고 있으며 파이썬 3.9 버전의 새로운 기능에 맞춰 코드와 내용이 업데이트되어 있습니다. 책에서는 클린 코드로서의 코드 포매팅과 좋은 코드의 특징 그리고 객체 지향 디자인에 대해서 소스코드를 통해 세세하게 알려주고 있습니다. 또한 파이썬의 리팩토링과 유닛 테스트에 대한 부분도 자세하게 설명하고 있어서 많은 도움이 되었습니다. 이 책을 통해서 프로퍼티, assertion , 데코레이터, 제너레이터, 이터레이터, ..