데이터마이닝 공부하면서 실습에 좋은 데이터들을 정리합니다.

[1] Weather 데이터
날씨에 따른 운동경기 여부에 대한 간단한 데이터입니다. 많은 데이터마이닝, 기계학습 등의 교재에서 이 데이터를 가지고 설명하고 있습니다.

[2] IRIS 데이터
붓꽃에 대한 데이터입니다. 꽃의 길이, 너비를 측정하여 종을 구분하는 데이터입니다. 데이터마이닝 알고리즘의 성능을 평가할 때 많이 전통적으로 많이 사용되는 데이터입니다.

[3] Boston Housing Price (보스턴 주택 가격) 데이터
집의 여러가지 조건과 집값에 대한 데이터입니다. 예측 알고리즘을 설명할 때 많이 사용됩니다.

[4] 학생들의 성적 데이터 (가상)
학생들의 수학, 과학, 영어, 체육, 봉사등급, 토론등급, 모의수능 점수에 대한 데이터입니다.

[5] 체력검사 데이터
간단한 분석의 예제 데이터로 사용할 수 있는 학생들의 체력검사에 대한 가상 데이터입니다.

[6] A자동차 회사의 고객 충성도 설문 데이터(가상)
고객들의 제품에 대한 가격만족도, 품질만족도, 디자인만족도, 브랜드태도가 고객의 회사에 대한 충성도에 어떠한 영향을 미치는 가를 파악하기 위한 가상 데이터이다.

[7] 학생들의 4과목 성적 데이터 (간단한 군집분석에 적합)
K-Means, EM 등의 군집 분석을 실습하기에 적합하도록 만든 데이터입니다.

[*] Data Mining for Intelligence (비지니스 인텔리전스를 위한 데이터마이닝) 교재의 예제 데이터셋 웹사이트
http://www.dataminingbook.com/datasets (id: wskim92, passwd: 6BkkVSW6Dj 로 로그인 할 것)

[*] 에듀팜 통계 교육 사이트의 예제 데이터

by 에이아이 2009. 9. 17. 18:03
| 1 |