유진의 코딩스토리
Azure ML Designer 실습 [군집 모델] 본문
데이터셋 등록
2000-2001
2002-2013
2014
총 3개의 데이터셋 등록
특성(feature) 선택
데이터병합
표준화
주성분 선택
데이터 분리
Split Rows > 행 단위로 split
2000 ~ 2013 : 594개 (train data)
2014 : 55개 (test data)
594 / 649 = 약 0.9152
random하게 split하지 않고 순차적으로 split (년도 순서 기준으로 data split 해야 함)
모델 학습
군집 예측
2014년 데이터로 test 진행
모델 평가
Maximal Distance to Cluster Center : 작을수록 모여있음
Average Distance to Cluster Center : 평균으로부터의 거리
Number of Points : 군집에 포함되는 point 개수
군집 1이 가장 좋은 것 같음
k=5인 경우
k=6, k=7
'Azure 실습 > Azure machine learning' 카테고리의 다른 글
Python ML 실습 [와인 분류 - 분류 모델] (0) | 2024.10.17 |
---|---|
Python ML 실습 [자전거 대여 수요 예측 - 회귀 모델] (0) | 2024.10.16 |
Azure ML Designer 실습 2 [자전거 대여 수요 예측 - 회귀 모델] (0) | 2024.10.10 |
Azure ML Designer 실습 [로켓 발사 여부 예측 - 분류 모델] (0) | 2024.10.08 |