캐글 타이타닉 데이터 분석을 해보았습다. 캐글 노트북에서 필요한 부분들을 참고하였으며 순서는 아래의 목차와 같습니다.
III. 모델링
보팅을 통해서 제출결과 accuracy 0.77990이 나왔다.
이번 타이타닉 데이터의 경우 타이타닉 원본 데이터 존재로 인해서 많은 사람들이 정확도가 1이 나올 수 있었고 이번 타이타닉 데이터 분석을 통해서 데이터분석에 관해 잘못 알고있었던 점과 부족했던 부분에 대해서 더 자세히 알게 되는 계기가 되었으며 기초적인 데이터일지라도 피처에 대해 많은 생각을 하게 되었던 캐글이였다. 특히나 모델링 부분에서 많은 점을 배울 수 있어서 좋은 경험이 되었다.
코드는 아래 캐글 커널에서 볼 수 있습니다.
https://www.kaggle.com/munmun2004/titanic-for-begginers
본 글은 아래의 사이트를 참고하였습니다.
참고]
Titanic Survival: Seaborn and Ensembles(https://www.kaggle.com/dejavu23/titanic-survival-seaborn-and-ensembles)
유튜브 오늘의 코드 박조은님의 영상(https://www.youtube.com/watch?v=qRWO-OMCMMM)
'Data Analysis > Kaggle' 카테고리의 다른 글
[kaggle][Bike Sharing Demand] 자전거 수요 예측 모델링 (0) | 2020.05.15 |
---|---|
[kaggle][Bike Sharing Demand] 자전거 수요 예측 EDA & FE (0) | 2020.05.15 |
[kaggle][house prices] 보스턴 집값 예측 모델링 (0) | 2020.05.08 |
[kaggle][house prices] 보스턴 집값 예측 EDA_FE (0) | 2020.05.08 |
[kaggle][titanic] 타이타닉 EDA 및 FE (0) | 2020.05.03 |