SAP 자격증을 취득한 후, AWS 자격증도 하나씩 공부해 보기로 결정했습니다. 기존에 머신러닝 관련 지식이 있어서, Machine Learning Specialty(MLS) 자격증 준비를 수월하게 진행했습니다. 시험 범위 자세한 내용은 AWS Certified Machine Learning - Specialty(MLS-C01) 시험 안내서를 참고하시는 게 좋을 거 같습니다. 섹션 시험 비율 도메인 1: 데이터 엔지니어링 20% 도메인 2: 예비 데이터 분석 24% 도메인 3: 모델링 36% 도메인 4: Machine Learning 구현 및 운영 20% 합계 100% 공부 방법 시험 안내서에 나온 AWS 내용에 대해서 FAQ를 적극 활용하였으며, Exam Prep Official Practice Que..
AWS 관련 프로젝트에 참여할 기회가 있었습니다. 비록 AWS 경험은 있었지만, 주니어로서 어필할 수 있는 부분이 제한적이라는 것을 느꼈습니다. 이러한 경험을 바탕으로, 다음에 참여하게 될 프로젝트에서 보다 전문적인 지식으로 기여하고자 하는 마음이 커졌습니다. 이를 실현하기 위해 자격증 취득을 통한 전문 지식 습득을 목표로 삼았습니다. 때마침 AWSKRUG에서 자격증 스터디 모집 공고를 보고, "어떤 자격증이든 1달 안에 취득할 의지만 있다면"이라는 문구에 자극받아 시작하게 되었습니다. SAA 공부 경험을 바탕으로 SAP에도 도전하기로 마음먹고, 곧장 디스코드 링크를 클릭했습니다. Join the AWS KRUG 자격증 소모임 Discord Server! Check out the AWS KRUG 자격증 ..
이 책은 CKA 취득 후에 Kubernetes 환경에서 airflow와 trino 그리고 kubeflow를 활용한 MLops 프로젝트를 위해서 사전에 공부를 하게 될 겸 읽게 되었습니다. 책을 읽으면서 예제 코드를 실습할 때 CKAD를 병행하여 재밌게 읽었던 거 같습니다. 이 책은 쿠버네티스에 애플리케이션을 배포하거나 쿠버네티스 기반 애플리케이션에 적용할 수 있는 패턴과 사례를 배우려는 실무자를 대상으로 하고 있습니다. 쿠버네티스를 활용한 애플리케이션 개발, 운영 환경 구축에 필요한 포괄적인 지식을 제공하며 각 패턴별로 모범 사례를 소개하고 있어 실무를 하는데 많은 도움이 될 거 같습니다. 글로벌 애플리케이션 분산: 사용자 경험 향상을 위해 애플리케이션을 글로벌하게 분산 배포하는 전략을 탐구합니다. 레이..
AWS EMR 데이터 파이프라인을 운영하면서 다루었던 스킬 셋에 대해서 정리를 할 겸 시험을 보게 되었습니다. 시험을 보게 된 계기는 "AWS상에서 EMR에서 spark를 이용해서 대용량 데이터 처리를 하였고 EC2 상에서 Airflow를 활용하여 오케스트레이션을 개발 및 운영하였고 AWS EKS의 추천모델을 위해서 전처리 경험이 있습니다."라고 하는 것보다 "AWS 어쏘 자격증 하나 있습니다. AWS에 대해서 기본은 다룰 줄 압니다."라고 말하는 게 편하게 때문이었습니다. AWS SAA-C03 합격 후기를 남기고자 합니다. 시험 범위 AWS의 자격증은 다음과 같습니다. 현재 Data Analytics와 Database, SAP on AWS가 24.4월 이후로 만료가 되는것으로 알고 있습니다. 이번에 시..
실무에 사용한 데이터 엔지니어링 스킬에 대한 정리내용입니다. 개인적인 기록을 위해 작성하였습니다. Stored Program 스토어드 프로그램은 데이터베이스 시스템 내에서 정의하고 저장하여 재사용 가능한 SQL 문의 모음입니다. 이는 스토어드 루틴이라고도 하며, 스토어드 프로시저, 스토어드 함수, 트리거, 이벤트 등을 포함합니다 스토어드 프로그램의 장점 데이터베이스의 보안 향상 기능의 추상화 네트워크 소요 시간 절감 절차적 기능 구현 개발 업무의 구분 스토어드 프로그램의 단점 낮은 처리 성능 애플리케이션 코드의 조각화 스토어드 프로그램의 구조 정의부 : 스토어드 프로그램의 헤더 부분, 주로 스토어드 프로그램의 이름과 입출력 값을 명시하는 부분 본문 부분 : 스토어드 프로그램의 바디(Body)라고도 하며,..
플랫폼을 운영하면서 실제로 플랫폼 환경을 구축해보고 싶어 쿠버네티스 상에서 데이터 파이프라인을 구축하려고 합니다. [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(1) - Hive Metastore MySQL로 구성 [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(2) - Hive Metastore 배포 [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(3) - Trino 설치 및 연동 Trino와 MinIO 설정 MinIO 설정 MinIO 클라이언트 초기 설정 MinIO 클라이언트(mc)를 사용해 MinIO 서비스에 접속합니다. kubectl port-forward pod/minio 9000 9090 -n minio-dev ./mc alias s..
플랫폼을 운영하면서 실제로 플랫폼 환경을 구축해보고 싶어 쿠버네티스 상에서 데이터 파이프라인을 구축하려고 합니다. 원천 데이터 소스의 경우 환경을 먼저 구축한 뒤에 데이터를 배치하려고 합니다. [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(1) - Hive Metastore MySQL로 구성 [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(2) - Hive Metastore 배포 [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(3) - Trino 설치 및 연동 Dockerfile 생성 Hive Metastore를 실행하기 위한 Docker 이미지를 만들기 위한 Dockerfile을 작성합니다. 하둡과 hive, mysql 커넥터의 경우 링크에서..
플랫폼을 운영하면서 실제로 플랫폼 환경을 구축해보고 싶어 쿠버네티스 상에서 데이터 파이프라인을 구축하려고 합니다. 원천 데이터 소스의 경우 환경을 먼저 구축한 뒤에 데이터를 배치하려고 합니다. [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(1) - Hive Metastore MySQL로 구성 [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(2) - Hive Metastore 배포 [GKE] Trino를 사용하여 MinIO에 저장된 데이터 쿼리하기(3) - Trino 설치 및 연동 Hive Metastore를 MySQL에 설정하고, Trino를 사용하여 MinIO에 저장된 데이터에 대한 쿼리를 실행하는 방법에 대해 포스팅하려고 합니다. Hive Metastore와 ..