글
데이터명 : IRIS (아이리스, 붗꽃 데이터)
레코드수 : 150개
필드개수 : 5개
데이터설명 : 아이리스(붓꽃) 데이터에 대한 데이터이다. 꽃잎의 각 부분의 너비와 길이등을 측정한 데이터이며 150개의 레코드로 구성되어 있다. 아이리스 꽃은 아래의 그림과 같다. 프랑스의 국화라고 한다.
필드의 이해 :
데이터의 이해를 돕기 위해 포함된 6개의 변수에 대하여 간략하게 설명한다.
총 6개의 필드로 구성되어있다. caseno는 단지 순서를 표시하므로 분석에서 당연히 제외한다.
2번째부터 5번째의 4개의 필드는 입력 변수로 사용되고, 맨 아래의 Species 속성이 목표(종속) 변수로 사용된다.
caseno | 일련번호이다. (1부터 150까지 입력된다.) |
Sepal Length | 꽃받침의 길이 정보이다. |
Sepal Width | 꽃받침의 너비 정보이다. |
Petal Length | 꽃잎의 길이 정보이다. |
Petal Width | 꽃잎의 너비 정보이다. |
Species | 꽃의 종류 정보이다. setosa / versicolor / virginica 의 3종류로 구분된다. |
데이터 테이블
[1] 원본 데이터 형태
데이터파일
(1) CSV - 콤마로 구분된 텍스트 파일 형식 (클레멘타인 등 데이터마이닝 프로그램에서 입력 가능함)
CSV 형식의 데이터 |
(2) 확장자가 SAV 인 SPSS 에서 사용가능한 형태의 데이터
SAV 형식의 데이터 |
(2) ARFF - WEAK 프로그램에서 입력받는 파일 형식
원본 데이터의 Weka 입력 형식(arff 파일) |
RECENT COMMENT