검색결과 리스트
웨카에 해당되는 글 4건
- 2009.08.02 [강좌] WEKA (웨카) 프로그램 다운로드 및 설치하기
- 2009.08.01 [강좌] WEKA 사용법 (간단한 분류, 의사결정트리 분석 설명) (6)
- 2009.07.31 웨카(WEKA) 소개 (데이터마이닝 분석 프로그램)
- 2009.07.20 웨카(WEKA) 프로그램 소개 및 설치방법 (14)
본 글에서는 데이터마이닝 공개 프로그램으로 유명한 웨카 프로그램을 인터넷에서 다운로드 받고 설치하는 방법을 설명합니다. 기본적으로 프로그램을 설치하고 실행하면 에러가 발생하는데 이것을 해결하는 방법도 설명하였습니다.
Weka 홈페이지 소개
웨카(weka) 설치 프로그램은 해당 프로젝트 홈페이지를 방문하여 다운로드 받을 수 있다.
* 프로젝트 명칭 : Weka Machine Learning Project * 프로젝트 주소 : http://www.cs.waikato.ac.nz/ml/weka/ |
1단계. 홈페이지를 방문한 후 왼쪽 편의 [Download] 를 클릭한다. |
2단계. 개발자 버전(소스코드 포함)에서 다운로드한다. 자바환경을 포함할 경우 34이고 포함하지 않을 경우 18M 정도이다. |
3단계. 전 단계에서 다운로드 하기 위해 <here> 부분을 클릭하면 [SourceForge.Net] 사이트를 통해 다운로드 할 수 있도록 연결된다. [Download] 글자를 클릭한다. |
4단계. 다양한 버전의 weka를 선택하여 다운로드 받을 수 있다. 2008년 8월 현재 3.5.8 버전까지 개발된 것을 확인할 수 있다. 3.4.13 버전을 클릭하였다. (최근 버전의 경우 오류가 발생할 수 있음으로 안정성이 있는 약간 이전의 버전을 선택했다.) |
5단계. weka-3-4-13jre.exe 파일을 클릭하여 다운로드 한다. |
6단계. [저장] 버튼을 눌러 다운로드를 시작한다. |
이제 다음 부분에서는 프로그램을 설치하고 실행하는 방법을 배워보도록 하겠다.
Weka 설치하고 실행하기
이전 단계에서 다운로드 한 설치 프로그램 파일을 더블클릭하여 실행한다.
설치 마법사가 실행되는데 아래와 같이 단계별로 선택하여 설치한다.
[1단계] [next] 버튼을 클릭한다. | [2단계] [next] 버튼을 클릭한다. |
|
[3단계] 설치 옵션을 선택한다. | [4단계] 설치할 폴더를 선택한다. |
|
|
이전 단계에서 weka 프로그램을 설치를 완료하였다.
설치를 완료하였으면 시작 프로그램에 weka가 등록된 것을 확인할 수 있다.
그럼 등록된 버튼을 눌러 weka를 실행해보자.
[시작] - [모든 프로그램] - [Weka 3.4.13] - [Weka 3.4] 경로로 실행하였다.
이러한 에러가 발생하는 이유는 자바 프로그램 실행시 기본적으로 지정되어 있는 메모리의 크기가 부족하기 때문에 발생하는 것이다. (컴퓨터에 설치된 메모리가 부족하기 때문은 아니다.)
따라서 이 문제를 해결하고 제대로 실행하기 위해서는 다음과 같은 명령으로 실행하면 된다.
java -Xmx256m -jar weka.jar |
위 명령을 수행하기 위해서는 도스 명령창을 띄우고, weka가 설치되어 있는 폴더로 이동한 후,
아래와 같이 명령을 실행하면 된다.
작은 프로그램 화면이 나타난다. 프로그램에는 weka 새의 그림이 표시되어 있다.
도스 프로그램 창에는 "---Registering Weka Editors-- " 라고 텍스트가 표시된 것을 볼 수 있다.
메모리 크기 설정 문제로 인해서 도스 명령어를 사용해서 실행하는 방법을 설명하였다.
이러한 방식은 번거롭기 때문에 배치(Batch) 파일을 만들어서 클릭만 하면 실행되도록 하는 것이 좋다.
[1단계] 아래와 같이 메모장을 사용하여 텍스트 파일을 만들자.
[2단계] 이 파일을 바탕화면에 두고 클릭하여 간단하게 실행할 수 있다. (또는 바로가기 링크)
[번역] Building Classification Models: ID3 and C4.5 (0) | 2009.08.02 |
---|---|
결정트리 알고리즘들의 비교 (C4.5 / CART / CHAID) (0) | 2009.08.02 |
[강좌] WEKA 사용법 (간단한 분류, 의사결정트리 분석 설명) (6) | 2009.08.01 |
EM 군집 알고리즘 소개 (Expectation Maximazation) (3) | 2009.08.01 |
HMM 알고리즘의 이해 (0) | 2009.07.31 |
본 글에서는 대표적인 데이터마이닝 프로그램인 WEKA를 사용하여 의사결정트리 분류 분석을 수행하는 방법을 설명합니다. 프로그램을 설치하면 기본적으로 제공되는 Weather 데이터를 사용하여 분석을 해보았습니다.
Weka 시작하기
weka 프로그램 설치와 실행을 성공하였으니 간단하게 프로그램을 사용해보도록 하자.
첫 화면에서 하단에 4개의 버튼이 보이는데 그 중 [Explorer]를 클릭한다.
그러면 아래의 오른쪽 그림과 같은 화면이 생성된다.
이번에는 날씨에 관련된 다른 데이터를 선택하고 분석을 수행해보도록 하자.
이 데이터는 날씨에 따라 Play 여부를 기록한 데이터이다. 날씨의 어떠함에 따라 운동경기를 했는지, 안했는지의 과거 정보들을 기록해둔 데이터이다. 이 데이터를 분석하면 어떤 날씨 조건에서 운동을 하는 것이 좋은 가에 대한 유용한 지식을 얻을 수 있을 것이다.
먼저 데이터를 이해하기 위해 설명한다. wether.nomial.csv 파일은 메모장으로 열면 아래와 같다.
Excel 프로그램으로 파일을 열면 오른쪽 그림과 같이 볼 수 있다.
위 파일을 Weka에서 입력으로 받아 분석하기 위해서는 ARFF 형식으로 변경해주어야 한다. CSV 형식은 WEKA 프로그램에서 입력으로 허용하지 않는다. ARFF 형식으로 변경한 결과는 아래와 같다.
ARFF 형식은 왼쪽 그림과 같이 @relation, @attribute, @data 의 3개의 영역으로 표현된다. 각 내용은 아래와 같이 입력한다. @relation 데이터명칭 @attribute 속성이름 {범주형의 값 리스트 } @data |
데이터는 범주형 속성 뿐 아니라 수치형 속성을 포함할 수도 있다.
위에서 소개한 Weather 데이터의 원래 형태는 아래와 같이 수치형으로 구성되어 있다.
위 파일을 ARFF 형식으로 변환한 결과는 아래와 같다.
|
위에서 설명한 바와 같이 @attribute 라인을 통해 각 속성에 대한 정보를 기록한다. 이 때, 범주형 속성과 수치형 속성을 구분하여 기록해주어야 한다.
(1) 범주형 속성 (2) 수치형 속성 즉, 수치형 속성은 속성의 이름을 적어 준 후, 뒤에 real 이라고만 기록해주면 된다. 범주형 속성의 경우 값을 모두 적어주지만, 수치형은 간단하다. |
@attribute 정의 부분에서 맨 아래쪽에 기입한 속성이 분석의 목표가 되는 속성으로 인식된다.
그럼, 위에서 설명하고 준비한 weather.nominal.arff 파일을 Weka를 사용하여 분석해보도록 하자. 초기화면에서 [Open file...]을 클릭하여 해당 파일을 선택하면, 아래 그림과 같이 표시된다.
단계1. 데이터를 선택한다. (우리는 이미 전 단계에서 weather.arff 파일을 선택하였다. )
단계2. 메뉴에서 [Classify]를 선택한다. 왼쪽 상단의 [Choose] 버튼을 클릭한 후 trees 항목에 속해있는 J48 알고리즘을 선택한다.
아래의 결과에서 가장 중요한 부분은 빨강색으로 표시한 트리(tree) 부분이다. 운동 경기(play)에 영향을 주는 속성은 조명(outlook), 습도(humidity), 풍량(windy)으로 분석되었다. 가장 중요한 속성은 조망(outlook)이다.
=== Run information ===
Scheme : weka.classifiers.trees.J48 -C 0.25 -M 2 Test mode: 10-fold cross-validation === Classifier model (full training set) === J48 pruned tree Number of Leaves : 5 Time taken to build model: 0.03 seconds === Stratified cross-validation === === Summary === === Detailed Accuracy By Class === === Confusion Matrix === |
위의 텍스트로 된 Tree 결과를 시각적으로 표시하면 의미를 쉽게 이해할 수 있다. Weka에서는 텍스트 뿐 아니라 시각적인 기능도 제공하고 있다. 왼쪽 하단의 [Result list] 부분에서 방금 수행된 [tree.J48] 항목에서 마우스 오른쪽 버튼을 누른 후 [Visualzie tree]를 클릭한다.
결정트리 알고리즘들의 비교 (C4.5 / CART / CHAID) (0) | 2009.08.02 |
---|---|
[강좌] WEKA (웨카) 프로그램 다운로드 및 설치하기 (0) | 2009.08.02 |
EM 군집 알고리즘 소개 (Expectation Maximazation) (3) | 2009.08.01 |
HMM 알고리즘의 이해 (0) | 2009.07.31 |
[참고글] 많이 사용되는 Data Mining 툴은? (2004년) (2) | 2009.07.29 |
본 글에서는 데이터마이닝 프로그램인 웨카(WEKA)를 소개합니다. 데이터마이닝에 대해 설명을 보고 싶다면 아래 링크를 클릭하세요. 데이터마이닝 소개 강좌 => http://ai-times.tistory.com/32 |
참고 : |
|
weka 프로그램은 [Weka Machine Learning Project] 라는 이름의 프로젝트로 꾸준하게 연구 개발되어지고 있다. 프로젝트 홈페이지( http://www.cs.waikato.ac.nz/ml/weka/ )에 방문하면 weka에 대한 자세한 정보들을 찾아 볼 수 있다.
추가적인 WEKA 프로그램 강좌
만약, WEKA 프로그램을 다운로드 받고 설치하는 방법이 궁금하다면 여기 를 클릭하라.
WEKA 프로그램을 사용하는 방법이 알고싶다면 여기 를 클릭하라.
WEKA 에서 기본적으로 지원하는 IRIS 데이터에 대하여 C4.5(J48)을 수행하는 과정을 설명하였다.
웨카(Weka) 프로그램을 소개합니다.
데이터마이닝 및 기계학습에서 오픈소스 및 공개 프로그램으로 유명한 웨카(Weka) 프로그램에 대해서 설명합니다. 아래의 3개의 주제로 글을 작성하여 <해당글>을 작성한 후 링크하였습니다.
(1)에서는 웨카 프로그램을 누가 만들었으며 어떻게 사용될 수 있는지 설명하고, (2)에서는 웨카 프로그램을 다운로드 받고 설치하고 실행하는 방법을 설명합니다. (3)에서는 웨카 프로그램을 사용하여 기본적으로 설치되는 IRIS 데이터를 가지고 의사결정트리 분류 분석을 수행하는 방법을 설명하였습니다.
[1] 웨카 프로그램 소개
[2] 웨카 프로그램 다운로드 및 설치
[3] 웨카 프로그램 간단히 다뤄보기 (분류, 의사결정 트리를 중심으로)
[4] 웨카 프로그램에서 군집 (Clustering) 분석 수행하기 (KMeans, EM 등)
웨카 프로그램 메뉴얼
(1) Weka Explorer Guide 문서 (2) Weka Tutorial 문서 (3) Weka Usage 발표자료 |
댓글