
[군집분석] MeanShift & DBSCAN 클러스터링 및 평가지표
Data Analysis
2021. 7. 30. 11:45
Clustering 비지도 군집분석 중 MeanShift와 DBSCAN에 대해 정리하고자 합니다. MeanShift는 특이한 형태를 지니는 data를 클러스터링 하기에는 한계가 존재하여 이러한 경우 DBSCAN을 사용하는 것으로 알고 있습니다. 해당 코드는 Sklearn 공홈을 참고하였으며 알고리즘의 공식 같은 경우에는 V-Measure: A conditional entropy-based external cluster evaluation measure 논문을 참고하였습니다. Mean-Shift 클러스터링 - KDE를 이용하여 개별 데이터 포인트들이 데이터 분포가 높은 곳으로 이동하면서 군집화를 수행하는 모델 - 사전에 군집화 개수를 지정하지 않으며 데이터 분포도에 기반해 자동으로 군집화 개수를 정하게 됨..