본 글에서는 데이터마이닝 프로그램인 웨카(WEKA)를 소개합니다. 
데이터마이닝에 대해 설명을 보고 싶다면 아래 링크를 클릭하세요. 
데이터마이닝 소개 강좌 => http://ai-times.tistory.com/32 

웨카(WEKA) 라는 세계적으로 유명한 데이터마이닝 프로그램을 설명하고자 한다.

만약, 여러분이 인공지능, 데이터마이닝 또는 기계학습(자동학습) 등의 분야를 공부하고 있다면 (아니면 이제 공부를 시작했다면) WEKA 라는 프로그램에 대해 여러차례 들어보았을 것이라 생각된다.

먼저 간단히 이 프로그램을 소개하면, 웨카 프로그램은 뉴질랜드와이카토(Waikato) 대학의 '이안 위튼' 교수팀에 의해 개발되어지고 있는 프로그램이다. 

웨카 프로그램이 전세계적으로 유명한 이유

1. 무료 데이터마이닝 프로그램이다.
대부분의 상용 데이터마이닝 프로그램들 (SPSS사의 Clementine, SAS사의 E-Miner 등) 이 설치크기가 매우 크고 가격이 고가이다보니 사용해보기가 쉽지 않은 불편함이 있다. WEKA 는 무료 프로그램이면서 기능 또한 상용프로그램에 뒤쳐지지 않는다. 오히려 더 많은 알고리즘들이 포함되어 있어 연구하는 입장에서는 매우 유용하다. 아래 쪽에 소개한 WEKA 홈페이지에 방문하여 다운로드할 수 있다.

2. 오픈 소스 프로그램이다.
이 프로그램은 오픈 소스 프로그램 (즉, 자바 JAVA 로 된 소스 코드 전체가 공개되어있음) 으로 데이터마이닝 알고리즘을 깊이 이해하고 또 활용하여 자신만의 프로그램을 개발할 경우에 매우 큰 도움이 된다.  
많은 국산 데이터마이닝 프로그램들도 WEKA 소스를 기초로 하여 (참고로 하여) 제작되었다.

3. 아직도 계속 업그레이드되고 있는 프로그램이다.
1999년부터 시작되어 지금까지 꾸준하게 업그레이드되며 개발되고 있는 프로그램이다. 새롭게 연구된 알고리즘들이 추가되고 있어서 최신 기술들을 테스트해볼 수가 있다. 또한 버전이 업그레이드될 수록 시각화 기능도 확장되는 등 기능 및 성능이 발전되고 있다.


왜 이름을 WEKA 라고 지었을까?

그런데 왜 이 데이터마이닝 프로그램의 이름을 weka라고 지었을까? 궁금증이 생겨 사전을 찾아보았다. 영어사전을 찾아보면 “뉴질랜드 산 호주뜸부기 조류(새)”라고 나온다.

참고 :

웨카(weka)는 뉴질랜드에서 자주 볼 수 있는 새의 이름이다. 우리나라에서는 볼 수 없어 말로 설명하기에는 어려울 듯하다. 쉽게 설명하면 뉴질랜드에서 작은 개울을 건너다니는 닭 비슷하게 생긴 새 정도로 설명하면 좀 이해가 갈 것이다. 이해를 돕기 위하여 weka 새의 사진을 추가하였다.


Weka라는 프로그램의 “Waikato Environment for Knowledge Analysis" 의 앞 글자를 따서 지어진 것이다. 이름에서 알 수 있듯이 이 프로그램은 뉴질랜드의 와이카토(Waikato) 대학에서 프로젝트를 수행하여 제작한 것이다.


좀 더 자세한 설명

  weka는 Java 언어로 개발된 데이터마이닝 프로그램이다. 여러 데이터마이닝 프로그램들이 고가이어서 접하기 힘든 것과 달리 weka는 무료로 제공되는 프로그램으로 쉽게 얻을 수 있다. 무엇보다도 weka는 오픈 소스로서 프로그램 전체에 대한 Java 언어로 된 소스코드를 제공하고 있어  데이터마이닝 프로그램을 개발하는 개발자들이 참고하기에 매우 유용한 프로그램이다. 상업용 프로그램이 아니라 연구용으로 제작된 프로그램이기 때문에 사용할 때 약간의 어려움이 느껴질 수도 있다. 무료이지만 여러 유료 프로그램들 보다 오히려 많은 다양한 분석 알고리즘들을 제공하고 있고, 시각적 분석 기능도 뛰어나 데이터분석에 유용하게 사용될 수 있는 프로그램이다.

 

   weka 프로그램은 [Weka Machine Learning Project] 프로젝트를 통해 개발되어졌고 지금도 계속 기능이 추가 및 개선되고 있다. 1999년 경 부터 프로젝트가 시작되었고, 2008년 10월 현재 3.5.8 버전 까지 개발되어 발표된 상태이다.


WEKA 프로그램 홈페이지 (웹사이트)

   weka 프로그램은 [Weka Machine Learning Project] 라는 이름의 프로젝트로 꾸준하게 연구 개발되어지고 있다. 프로젝트 홈페이지( http://www.cs.waikato.ac.nz/ml/weka/ )에 방문하면 weka에 대한 자세한 정보들을 찾아 볼 수 있다.




추가적인 WEKA 프로그램 강좌

만약, WEKA 프로그램을 다운로드 받고 설치하는 방법이 궁금하다면 여기 를 클릭하라.

WEKA 프로그램을 사용하는 방법이 알고싶다면 여기 를 클릭하라.
WEKA 에서 기본적으로 지원하는 IRIS 데이터에 대하여 C4.5(J48)을 수행하는 과정을 설명하였다.

by 에이아이 2009.07.31 21:32