군집분석 공부
Holly Yoon
군집화란 유사한 속성들을 갖는 관측치들을 묶어서 전체 데이터를 몇 개의 군집으로 나누는 것 군집화의 기준 동일한 군집에 소속된 관측치들은 유사할 수록 좋다 상이한 군집에 소속된 관측치들은 서로 다를 수록 좋다 군집화 수행시 주요 고려사항 어떤 거리 척도를 사용해서 유사도를 측정할 것인가? 유클리디안 거리 맨하탄 거리 마할라노비스 거리 상관계수 거리 어떤 군집화 알고리즘을 사용할 것인가? 계층적 군집화 : 개별 개체간의 순차적 구분 분리형 군집화 : 특정 기준에 의해 동시에 구분 자기조직화 지도 분포 기반 군집화 어떻게 최적의 군집 수를 결정할 것인가? Elbow Point 어떻게 군집화 결과를 측정하고 평가할 것인가? 1. 계층적 군집화 (Hierarchical Clustering) 개별 개체들의 순차적..