분류와 예측의 차이점

  분류(Classification) 기법과 예측(Prediction) 기법에 대해서 혼동하는 경우가 있어서 잠깐 설명하고자 한다. 분류와 예측은 모두 레코드의 특정 속성의 값을 미리 알아맞히는 점에서는 같지만 약간의 차이가 있으므로 구분되어질 필요가 있다. 분류와 예측의 차이점은 알아맞히고자 하는 속성이 범주형인가 연속형(수치형)인가에 따라 구분된다.

  * 분류 :  레코드(튜플)의 범주형 속성의 값을 알아맞히는 것이고,
  * 예측 :  레코드(튜플)의 연속형 속성의 값을 알아맞히는 것이다.

    분류는 학생들의 국어, 영어, 수학 점수를 입력으로 하여 내신등급을 알아맞히는 것 이라든가, 카드회사에서 회원들의 가입 정보를 입력으로 하여 1년 후의 신용등급을 알아맞히는 것 등을 예로 들 수 있다.

   반면에, 예측의 예를 들어보면 아래와 같다. 학생들의 여러 가지 정보를 입력으로 하여 수능점수를 알아맞히는 것 이라든가, 카드회사에서 회원들의 가입정보를 입력으로 하여 연 매출액을 알아맞히는 것을 예로 들수 있다. 또는 여러 가지 사회 현상 정보를 입력으로 하여 다음 달의 주가를 알아맞히는 것도 하나의 예가 되겠다.

신고
by 에이아이 2009.08.13 16:48