융무의 기술블로그
article thumbnail

https://www.kaggle.com/c/nyc-taxi-trip-duration

지난 캐글 대회인 New York City Taxi Duration에 대해서 여행기간 예측을 하였습니다.

본 글은 캐글 커널을 참조하였으며 아래의 순서로 데이터 분석을 진행하였습니다.

III. 모델링

IV. 예측

제출 결과 rmsle score 0.38135가 나왔습니다. 데이터 이상치 조절을  하고 각 피처들에 대해 데이터 처리를 더 해준다면 모델의 성능을 더 올릴 수 있을거같습니다.

 

본 글의 코드는 다음 캐글 커널에서 확인 할 수 있습니다.

https://www.kaggle.com/munmun2004/nyc-taxi

 

NYC Taxi 한글커널

Explore and run machine learning code with Kaggle Notebooks | Using data from New York City Taxi Trip Duration

www.kaggle.com

본 커널은 아래 커널들을 참고 하였습니다.

Beat the benchmark!(https://www.kaggle.com/danijelk/beat-the-benchmark)

ML Workflow | LightGBM ≈ 0.37, RandomForest ≈ 0.39(https://www.kaggle.com/quentinmonmousseau/ml-workflow-lightgbm-0-37-randomforest-0-39)

profile

융무의 기술블로그

@융무

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!