- 크롤링해온 데이터를 통해서 데이터탐색을 해보려고 한다.
크롤링을 통해서 내가 원하는 부분만을 가져와서 전처리할게 별로 없었다.
-모든 변수들에 대해서 countplot을 그려서 분포를 확인했었고
-heatmap을 통해서 변수들의 연관성에 대해서 생각을 해보았다.
-spss 카이제곱 검정을 통해서 변수들의 연관성 여부에 대해서 검정을 실시해보았고 기존 연구에서 유의미하다고 생각되는 변수들도 순위에 영향을 줄거라고 생각을 해보고 데이터 분석을 실시하였다.
EDA를 통해 연관성있는 변수들에 대해서 따로 지정을 해주고 초단위를 정제해주었다.
그 다음 더미변수들을 생성하여 데이터에 merge merge하였고
전처리 된 데이터를 새롭게 csv형태로 만들어주었다.
'Data Analysis' 카테고리의 다른 글
[R] Groceries 데이터 연관규칙분석 (0) | 2019.11.27 |
---|---|
[경마 데이터 분석] 경마 데이터 모델링 및 분석 (0) | 2019.11.27 |
[python][경마 데이터 분석]경마 말혈통정보 크롤링 Xpath (0) | 2019.11.25 |
[python][경마 데이터 분석]경마 렛츠런파크 크롤링 Xpath (0) | 2019.11.25 |
[python] 야구데이터 크롤링 BeautifulSoup (0) | 2019.11.25 |