데이터명 : IRIS (아이리스, 붗꽃 데이터)  
레코드수 : 150개
필드개수 : 5개

데이터설명 : 아이리스(붓꽃) 데이터에 대한 데이터이다. 꽃잎의 각 부분의 너비와 길이등을 측정한 데이터이며 150개의 레코드로 구성되어 있다. 아이리스 꽃은 아래의 그림과 같다. 프랑스의 국화라고 한다.

사용자 삽입 이미지

필드의 이해 :
데이터의 이해를 돕기 위해 포함된 6개의 변수에 대하여 간략하게 설명한다.  
총 6개의 필드로 구성되어있다. caseno는 단지 순서를 표시하므로 분석에서 당연히 제외한다.
2번째부터 5번째의 4개의 필드는 입력 변수로 사용되고, 맨 아래의 Species 속성이 목표(종속) 변수로 사용된다.

 caseno 일련번호이다. (1부터 150까지 입력된다.)
 Sepal Length 꽃받침의 길이 정보이다.
 Sepal Width 꽃받침의 너비 정보이다.
 Petal Length 꽃잎의 길이 정보이다.
 Petal Width 꽃잎의 너비 정보이다.  
 Species 꽃의 종류 정보이다.  setosa / versicolor / virginica 의 3종류로 구분된다.

사용자 삽입 이미지


데이터 테이블

[1] 원본 데이터 형태

사용자 삽입 이미지

데이터파일

(1) CSV - 콤마로 구분된 텍스트 파일 형식 (클레멘타인 등 데이터마이닝 프로그램에서 입력 가능함) 

 CSV 형식의 데이터

(2) 확장자가 SAV 인 SPSS 에서 사용가능한 형태의 데이터 

 SAV 형식의 데이터

(2) ARFF - WEAK 프로그램에서 입력받는 파일 형식

 원본 데이터의 Weka 입력 형식(arff 파일)

by 에이아이 2009. 11. 29. 22:35