유진의 코딩스토리

Azure ML Designer 실습 [군집 모델] 본문

Azure 실습/Azure machine learning

Azure ML Designer 실습 [군집 모델]

놀고먹는 유진 2024. 10. 11. 18:33

 

 

데이터셋 등록

 

2000-2001

2002-2013

2014

총 3개의 데이터셋 등록

 

 

 

 

특성(feature) 선택



데이터병합

 

표준화

 

 

 

 

 

 

 

주성분 선택

 

 

데이터 분리

Split Rows > 행 단위로 split

 

2000 ~ 2013 : 594개 (train data)

2014 : 55개 (test data) 

594 / 649 = 약 0.9152

 

random하게 split하지 않고 순차적으로 split (년도 순서 기준으로 data split 해야 함)

 

 

모델 학습

 

 

 

 

 

군집 예측

2014년 데이터로 test 진행

 

 

모델 평가

Maximal Distance to Cluster Center : 작을수록 모여있음

Average Distance to Cluster Center : 평균으로부터의 거리

 

Number of Points :  군집에 포함되는 point 개수

 

군집 1이 가장 좋은 것 같음

 

 

k=5인 경우

k=6,  k=7