목록전체 글 (23)
유진의 코딩스토리
https://archive.ics.uci.edu/dataset/186/wine+quality UCI Machine Learning RepositoryThis dataset is licensed under a Creative Commons Attribution 4.0 International (CC BY 4.0) license. This allows for the sharing and adaptation of the datasets for any purpose, provided that the appropriate credit is given.archive.ics.uci.edu 와인 데이터셋은 매우 유명해서 다 알 것이다.해당 와인 데이터셋에서 숫자 데이터인 alcohol, sugar, pH 컬럼만 ..
자전거 대여 수요를 예측하는 모델을 만들기 위해서 먼저 kaggle에서 데이터셋을 가져온다. https://www.kaggle.com/c/bike-sharing-demand/overview Kaggle: Your Machine Learning and Data Science CommunityKaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.www.kaggle.com kaggle에서 설명해주는 각 feature에 대한 설명이다. datetime - 년월일 + timestamp season - 1 = spring, 2..
데이터셋 등록 2000-20012002-20132014총 3개의 데이터셋 등록 특성(feature) 선택데이터병합 표준화 주성분 선택 데이터 분리Split Rows > 행 단위로 split 2000 ~ 2013 : 594개 (train data)2014 : 55개 (test data) 594 / 649 = 약 0.9152 random하게 split하지 않고 순차적으로 split (년도 순서 기준으로 data split 해야 함) 모델 학습 군집 예측2014년 데이터로 test 진행 모델 평가Maximal Distance to Cluster Center : 작을수록 모여있음Average Distance to Cluster Center : 평균으로부터의 거리 Number of P..
문제정의 [자전거 수요에 영향을 미치는 요소]- 날씨- 계절- 휴일/평일 ◆ 주제 : 날씨, 계절, 휴일/평일 여부에 따른 자전거 수요 예측 모델 구현 데이터 확인 우선 엑셀파일에서 데이터를 대충 확인해보자. • day – 관찰이 이루이진 날짜• mnth – 관찰이 이루어진 월• year – 관찰이 이루어진 년도• season – 계절 (1: 겨울. 2: 봄, 3: 여름, 4: 가을)• holiday – 공휴일 여부 (1:공휴일, 0: 공휴일아님)• weekday – 요일 (0:일, 1:월, 2:화, 3:수, …, 6:토)• workinday – 근무일 여부 (1:근무일, 0:근무일 아님)• weathersit – 날씨 상황 • 1 : Clear, Few clouds, Partly cloudy, ..
Azure 머신러닝 (Machine Learning)Azure 클라우드에서 머신러닝을 개발/운영하기 위한 서비스 리소스로 Azure 머신러닝은 Microsoft의 클라우드 서비스를 이용해 머신러닝 모델을 쉽게 만들고, 학습시키고, 배포할 수 있도록 도와주는 서비스입니다. 이 서비스를 사용하면 복잡한 작업을 쉽게 할 수 있고, 대규모 데이터를 처리하면서도 필요한 컴퓨팅 자원을 쉽게 확장할 수 있습니다 • Compute : 컴퓨터가 복잡한 계산이 필요할 때, Azure에서는 컴퓨터 자원을 빌려서 더 빠르고 쉽게 사용할 수 있다. 예를 들어, 클라우드에서 아주 강력한 컴퓨터를 빌려서 머신러닝 모델을 학습시키는 것으로 이해하면 쉽다. • Data Storage : 머신러닝을 하려면 많은 데이터를 사용해서 모..