융무의 기술블로그
article thumbnail

지난 캐글 대회인 San Francisco Crime Classification에 대해서 범죄분류를 하였습니다.

본 글은 캐글 커널을 참조하였으며 아래의 순서로 데이터 분석을 진행하였습니다.

I. 데이터 불러오기 및 확인 

제출 결과  multi-class logarithmic loss score 2.34074로 72등에 위치하고 상위 4% 안에 들었습니다.

모델을 만들고 하이퍼 파라미터 튜닝을 Bayesian Optimization으로 해주면 모델의 성능을 더 높일수 있을거 같습니다.

Bayesian Optimization에 대해서는 다음에 일반 classfication 모델을 만들때 해보려고 합니다.

처음으로 해본 multiclassfication이였지만 모델링 과정에서 많은 것을 배웠으며 범죄 데이터 처리에 대해

다양한 데이터를 활용할수 있어서 유용한거 같습니다.

 

본 글의 코드는 다음 캐글 커널에서 확인 할 수 있습니다.

https://www.kaggle.com/munmun2004/san-francisco-crime-classification

 

[한글커널][San Francisco Crime Classification]

Explore and run machine learning code with Kaggle Notebooks | Using data from San Francisco Crime Classification

www.kaggle.com

본 커널은 아래 커널들을 참고 하였습니다.

SF crime classification(https://www.kaggle.com/mohitsital/sf-crime-classification)

 

 

profile

융무의 기술블로그

@융무

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!