지난 캐글 대회인 New York City Taxi Duration에 대해서 여행기간 예측을 하였습니다.
본 글은 캐글 커널을 참조하였으며 아래의 순서로 데이터 분석을 진행하였습니다.
III. 모델링
IV. 예측
제출 결과 rmsle score 0.38135가 나왔습니다. 데이터 이상치 조절을 하고 각 피처들에 대해 데이터 처리를 더 해준다면 모델의 성능을 더 올릴 수 있을거같습니다.
본 글의 코드는 다음 캐글 커널에서 확인 할 수 있습니다.
https://www.kaggle.com/munmun2004/nyc-taxi
본 커널은 아래 커널들을 참고 하였습니다.
Beat the benchmark!(https://www.kaggle.com/danijelk/beat-the-benchmark)
ML Workflow | LightGBM ≈ 0.37, RandomForest ≈ 0.39(https://www.kaggle.com/quentinmonmousseau/ml-workflow-lightgbm-0-37-randomforest-0-39)
'Data Analysis > Kaggle' 카테고리의 다른 글
[kaggle][San Francisco Crime Classification]샌프란시스코범죄분류 (0) | 2020.06.12 |
---|---|
[kaggle][New York City Taxi Duration] 뉴욕 택시 여행기간 EDA&FE (0) | 2020.06.01 |
kaggle][필사]Predict Future Sales (0) | 2020.05.23 |
[kaggle][Bike Sharing Demand] 자전거 수요 예측 모델링 (0) | 2020.05.15 |
[kaggle][Bike Sharing Demand] 자전거 수요 예측 EDA & FE (0) | 2020.05.15 |