데이터명 : IRIS (아이리스, 붗꽃 데이터)  
레코드수 : 150개
필드개수 : 5개

데이터설명 : 아이리스(붓꽃) 데이터에 대한 데이터이다. 꽃잎의 각 부분의 너비와 길이등을 측정한 데이터이며 150개의 레코드로 구성되어 있다. 아이리스 꽃은 아래의 그림과 같다. 프랑스의 국화라고 한다.

사용자 삽입 이미지

필드의 이해 :
데이터의 이해를 돕기 위해 포함된 6개의 변수에 대하여 간략하게 설명한다.  
총 6개의 필드로 구성되어있다. caseno는 단지 순서를 표시하므로 분석에서 당연히 제외한다.
2번째부터 5번째의 4개의 필드는 입력 변수로 사용되고, 맨 아래의 Species 속성이 목표(종속) 변수로 사용된다.

 caseno 일련번호이다. (1부터 150까지 입력된다.)
 Sepal Length 꽃받침의 길이 정보이다.
 Sepal Width 꽃받침의 너비 정보이다.
 Petal Length 꽃잎의 길이 정보이다.
 Petal Width 꽃잎의 너비 정보이다.  
 Species 꽃의 종류 정보이다.  setosa / versicolor / virginica 의 3종류로 구분된다.

사용자 삽입 이미지


데이터 테이블

[1] 원본 데이터 형태

사용자 삽입 이미지

데이터파일

(1) CSV - 콤마로 구분된 텍스트 파일 형식 (클레멘타인 등 데이터마이닝 프로그램에서 입력 가능함) 

 CSV 형식의 데이터

(2) 확장자가 SAV 인 SPSS 에서 사용가능한 형태의 데이터 

 SAV 형식의 데이터

(2) ARFF - WEAK 프로그램에서 입력받는 파일 형식

 원본 데이터의 Weka 입력 형식(arff 파일)

신고
by 에이아이 2009.11.29 22:35
음성인식 문제에 최적화된 신경망(ANN) 공개 프로그램입니다.

아래의 주소에 방문하면 연구내용을 볼 수 있고 프로그램도 다운로드 할 수 있습니다.

http://nico.nikkostrom.com/


사용자 삽입 이미지

다운로드 홈페이지
http://sourceforge.net/projects/nico/

여기서 바로 다운로드 하기


그리고 아래는 연구실 홈페이지 입니다. 음성인식 분야를 주로 연구하는 연구실입니다.
http://www.speech.kth.se/software/

사용자 삽입 이미지



신고
by 에이아이 2009.11.16 11:35

본 글에서는 Cronbach's Alpha 에 대해 정리하고자 한다.

 참고자료1: http://www.test-market.kr/397 (신뢰도분석 Cronbach's Alpha)
 참고자료2: http://en.wikipedia.org/wiki/Cronbach's_alpha
 참고자료3: http://blog.daum.net/jhlee03/262 신뢰도, 내적일관성의 통계적 의미 설명

Cronbach's  α(Alpha) 는 [크론바하 알파] 라고 읽는다.
(또는 [크론바흐 알파] 라고도 함, 또는 간단하게 [알파(값)] 라고도 한다.)
크론바하 라는 통계학자가 설문의 신뢰도를 평가하기 위하여 1951년에 제안한 평가값이다. 

<사용목적>

- 설문지의 신뢰도를 평가하기 위하여 사용한다.
- 설문항목에 대하여 신뢰성을 저해하는 항목(문항)을 찾아내고 제거하기 위하여 사용한다.

<신뢰도를 평가한다는 의미는 무엇인가?>

보통 설문지를 통해 몇 개의 개념들을 평가한다. 각 개념들을 측정하기 위해서 몇 개의 질문(문항)을 준비하는 것이 일반적이다. 이때, 이 여러 문항들이 얼마나 일관성이 있는가? 하나의 개념을 측정하고 있는가? 의 정도를 의미한다. 그래서 [내적 합치도] 라고도 부른다. (Cronbach's Alpha = 내적 합치도 계수)  

<여러가지 이름들>
Cronbach's Alpha 는 여러가지 이름들로 불리고 있다. 이름이 많이 이해할 때 혼동할 수 있어 아래에 이름들을 정리해보았다. 다 같은 의미로 이해하면 된다.
- 신뢰성 지수(계수)
- 내적 합치도 지수(계수)
- 동질성 지수(계수)
- 내적 일관성 신뢰도(지수) (Internal consistency realiability)
- 알파 값

<신뢰도 평가 기준>

Cronbach's  α 값은 0에서 1사이의 값을 가지며 1에 가까울 수록 신뢰도가 높다고 해석된다.
신뢰도가 높다 낮다의 판정 기준값으로 0.6 을 사용하는 경우가 많으며 0.7을 사용하기도 한다. (참고)

<예제를 통한 설명>

예를들어, 회사지원들의 스트레스 요인을 분석하기 위한 설문에서
아래의 몇 항목들이 서로 같은 내용(부서 내의 몰입도)을 평가하도록 했다고 하자.
이들이 실제로 같은 개념을 평가하고 있는가? 일관성(신뢰도)가 있는가?
(이 예제는 위의 참고자료1을 참고한 것임.)

항목04.  부서내의 소외감을 느끼는가?
항목08.  책임감 결여되었는가?
항목09.  불안정한 가정분위기?
항목10.  본인의 리더쉽이 부족하다고 느끼는가?  

위 항목들을 대상으로 Cronbach's Alpha 값을 계산하여 0.67의 값을 얻었다고하자.
그러면 0.6을 판정기준으로 했으때 위 4개의 항목들은 같은 개념(조직의 몰입도)를 평가하는데 신뢰성이 있다고 판단될 수 있다.

<요인분석과 Cronbach's Alpha>

설문항목들의 신뢰도를 평가하기 위해서 <요인분석>을 함께 사용하는 경우가 많다.
주어진 데이터에 대해서 <요인분석>을 수행한다. 요인분석의 결과로 몇 개의 변수들간의 서로 같은 개념으로 묶이는 것을 발견할 수 있다.

이들 묶음에 대하여 Cronbach's alpha 값(알파값)을 계산할 수 있는데, 이 값이 기준값(0.6 or 0.7)보다 크면 해당되는 몇 개의 항목들이 신뢰도가 높다고 판단할 수 있다.

이때, 어떤 변수를 제거,삽입하면 알파값이 변동이 발생하게 된다.
어떤 변수를 제거했을 때 알파값이 상승된다면 그 변수(항목)은 제외하는 것이 오히려 설문의 신뢰성을 높이는데 좋다. 반대로, 어떤 변수를 제거했을 때 알파값이 큰 변동이 없거나 낮아진다면 그 변수는 신뢰성을 위해 필요한 변수라고 평가할 수 있다.

<SPSS를 사용한 Cronbach's Alpha 값 측정>

SPSS 에서는 Cronbach's Alpha 값을 측정하도록 지원하고 있다.
사용 방법은 준비 중입니다...

영문판 : [analyze] - [scale] - [reliability analysis]
한글판 : [분석] - [척도화 분석] - [신뢰도 분석]

신뢰도를 평가할 항목들을 선택한 후 (오른쪽으로 옮긴 후)
[확인] 버튼을 눌러 신뢰도 분석을 할 수 있다.







신고
by 에이아이 2009.11.09 12:31

오피스 2007(워드, 엑셀, 파워포인트, 엑세스, 아웃룩) 메뉴 변환 방법 (예전 방식의 메뉴로)

오피스 2007 버전을 사용하는 경우 메뉴의 구성이 이전 버전과는 너무 많이 변경되어서
오히려 사용하기가 불편한 점이 있습니다.
그래서 2007버전보다는 2003 버전을 사용하는 경우도 많이 있습니다.

오피스 2007을 사용하는 경우에도
Classic Menu for Office 2007 이라는 프로그램을 설치하면
오피스 2007 버전의 메뉴를 오피스 2003의 형태로 변환할 수 있습니다.

파일 다운로드


위에 첨부된 파일을 다운로드 한 후 설치하면, 바탕화면에 메뉴 변환 프로그램 아이콘이 추가됩니다.
아이콘을 클릭하여 메뉴 변환 프로그램을 실행한 후 아래와 같이 셋팅합니다.



위와 같이 셋팅한 후 Office 2007 프로그램을 실행해보면 아래와 같이 메뉴가 생성된 것을 볼 수 있습니다.

변경 후 OFFICE 2007 화면 그림



출처 : http://www.addintools.com/
참고1: http://osnews.kr/314


신고
by 에이아이 2009.10.28 21:54

1. 신경망(Neural Network)의 소개

신경망 알고리즘은 인간의 두뇌를 모델로 한 분석 방법이다. 인간의 두뇌는 약 10^11개의 뉴런이 매우 큰 개수의 시냅스에 서로 간에 연결되어 있다. 각 뉴런(neuron)들은 시냅스(연결선)에 의하여 서로 정보를 교환한다. 특정 뉴런에 신호가 입력되면 그 뉴런은 시냅스에 의해 연결된 다른 노드로 신호를 전달하고 이러한 과정이 계속되어 뇌는 새로운 것을 학습하게 된다는 이론에 기초하고 있다.

뉴런의 구조는 아래의 그림을 참고하기 바란다. 신경망 알고리즘을 이해하기 위해서 뇌의 구조를 깊이있게 이해해야 할 필요는 없음으로 크게 부담갖을 필요는 없다.


2. 신경망의 구조

신경망은 인간의 뇌의 구조를 모델로하여 아래와 같은 구조를 통해 학습(Learning)을 수행한다.


3. 신경망 알고리즘의 역사

신경망의 역사에 대해서 아래의 표를 참고하기 바란다.
아래의 표는 [Neural Connection을 이용한 데이터마이닝 신경망분석]의 p.6 에서 발췌하였다.
 
신경망 알고리즘을 최신 기술로 알고 있는 사람들도 있지만 사실은 그렇지 않다. 1950년대 부터 신경망 알고리즘의 기초적인 아이디어가 제안되었고 지금까지 발전되는 가운데 여러 분야에서 사용되고 있다. 한동안 인공지능 및 신경망의 한계가 제시되어 침체기를 걷기도 하였으나 오히려 최근에 들어 다양한 분야에서 많이 활용되고 있다. 

 연도

 연구자

연구 내용

 1958년

 프랑크 로센블라크
 (Frank Rosenblastt)

최초의 인식 모형 발명
(후에 신경망의 기초가 됨)  

 1967년

 민스키 & 페페트
 (Minsky & Papert)

인식 모형 구조의 문제 해결의 한계 발표
(저서 'Perceptron'를 통해)

 1982-1984년

 홉필드 & 코호넨
 (Hopfield & Kohonen)

인식 모형의 구조 문제 해결을 하면서 오류-역전파망을 이용한 다층인식모형의 탄생


4. 신경망 관련 동영상

[1] The Next Generation of Neural Networks [동영상보기]
[2] Neural Network Lesson 1 : Single-Layer Perceptrons [동영상보기]
[3] Neural Network Lesson 2 : Probabilistic Neural Networks [동영상보기]
[4] C++ Console Lesson 13: Perceptron Training [동영상보기]

참고자료 (교재)  

[1] Neural Connection을 이용한 데이터마이닝 신경망분석, 고려정보산업, 조용준/허준/최인규 공저, 1999년


[논문] 신경망 분석을 이해하는 데 도움이 되는 참고 논문

[1] 인공신경망분석의 이해와 활용, 2008년, 유제민, 한국심리학회 [논문정보]
(KISS 논문 검색사이트를 통해 검색함. 검색어: 신경망)
내용 : 신경망 알고리즘에 대한 대략적인 소개가 설명되어 있습니다. 자세한 수식 등을 설명되지 않으며, 신경망에 대한 간단한 소개자료입니다. 2페이지로 간단하게 소개와 특징, 장점등이 기술되어 있습니다.



[논문] 신경망을 활용한 논문

[1] 생명보험사의 개인연금 보험예측을 사례를 통해서 본 의사결정나무 분석의 설명변수 축소에 관한 비교 연구, 이용구(중앙대학교 수학통계학부), 허준(SPSS Korea), 2009년 데이터정보과학회 논문지 게제. [논문정보]
(KISS 논문 검색사이트를 통해 검색함. 검색어 신경망)
내용 : 신경망 알고리즘을 사용하여 변수를 축소한 후 결정트리를 통한 의사결정을 하는 것이 효과적이라는 내용이다. 데이터(변수) 축소를 위해서 신경망을 활용하였다.



<참고자료>

[1] 신경망을 사용하여 동물을 분류하는 프로젝트
http://blog.naver.com/shine10ee?Redirect=Log&logNo=10047902225&vid=0

[2] 신경망 소스 코드 제공 사이트
http://lcn.epfl.ch/tutorial/english/

[3] 충북대 오창석 교수님의 <뉴로컴퓨터 개론> 책(9장. 신경망)에 대한 강의자료입니다.
http://blog.paran.com/fuzzyrisk/26175430#
 1) 뉴로 컴퓨터란?
 2) 생물학적 신경망
 3) 인공신경망 모델
 4) 신경망의 유형
 5) 활성화 함수
 6) 패턴 분류
 7) 퍼셉트론
 8) 연상메모리
  9) BP(오류역전파)알고리즘
 10) 뉴로 컴퓨터 응용

[4] SAS에서의 신경망 활용 예제


[5] 신경망의 응용

신고

'신경망' 카테고리의 다른 글

신경망 알고리즘 소개  (4) 2009.10.26
by 에이아이 2009.10.26 14:46

* 내외간의 호칭
  (1) 남편에 대한 호칭
    ① 신혼 초 : 여봐요, 여보, ○○씨
    ② 자녀가 있을 때 : 여보, ○○ 아버지
  (2) 아내에 대한 호칭
    ① 신혼 초 : 여보요, 여보, ○○씨
    ② 자녀가 있을 때 : 여보, ○○ 엄마
    ③ 장노년 : 여보, 임자, ○○ 할머니

 * 시부모에 대한 호칭
   
① 시아버지에 대한 호칭 : 아버님
   ② 시어머니에 대한 호칭 : 어머님

* 며느리에 대한 호칭
  
① 신혼 초 : 아가, 새아가
   ② 자녀가 있을 때 : 어미야, ○○ 어미야

* 처부모에 대한 호칭.
   ① 장인에 대한 호칭 : 장인 어른, 아버님
   ② 장모에 대한 호칭 : 장모님, 어머님

* 사위에 대한 호칭.
   ○서방, 여보게, ○○이

* 내외의 동기(同氣)와 그 배우자(配偶者)에 대한 호칭.
    (1) 남편의 동기와 그 배우자에 대한 호칭
       ① 남편의 형 : 아주버님
       ② 남편의 아우 : 도련님
       ③ 남편의 누나 : 형님
       ④ 남편의 누이동생 : 아가씨, 아기씨
       ⑤ 남편의 형의 아내 : 형님
       ⑥ 남편의 아우의 아내 : 동서
       ⑦ 남편의 누나의 남편 : 서방님
       ⑧ 남편의 누이동생의 남편 : 아주버님, 서방님
    (2) 아내의 동기와 그 배우자에 대한 호칭
       ① 아내의 오빠 : 처남, 형님
       ② 아내의 남동생 : 처남, ○○(이름)
       ③ 아내의 언니 : 처형
       ④ 아내의 여동생 : 처제
       ⑤ 아내의 오빠의 부인 : 아주버니
       ⑥ 아내의 남동생의 부인 : 처남댁
       ⑦ 아내의 언니의 남편 : 형님, 동서
       ⑧ 아내의 여동생의 남편 : 동서, ○ 서방

* 동기와 그 배우자의 호칭.
    (1) 남자의 경우
       ① 형 : 형, 형님
       ② 형의 아내 : 아주머님, 형수님
       ③ 남동생 : ○○(이름), 아우, 동생
       ④ 남동생의 아내 : 제수씨, 계수씨
       ⑤ 누나 : 누나, 누님
       ⑥ 누나의 남편 : 매부, 매형
       ⑦ 여동생 : ○○(이름), 동생, ○○ 어머님(엄마)
       ⑧ 여동생의 남편, 매부, ○ 서방
   (2) 여자의 경우
       ① 오빠 : 오빠, 오라버니(님)
       ② 오빠의 아내 : (새) 언니
       ③ 남동생 : ○○(이름), 동생, ○○ 어머니(엄마)
       ④ 남동생의 아내 : 올케, ○○ 어머니(엄마)
       ⑤ 언니 : 언니
       ⑥ 언니의 남편 : 형부
       ⑦ 여동생 : ○○(아루), 동생, ○○어머니(엄마)
       ⑧ 여동생의 남편 : ○ 서방, ○○ 아버지(아빠)

* 숙질(叔姪)간의 호칭.
   (1) 아버지의 형 : 큰아버지
   (2) 아버지의 형의 아내 : 큰어머니
   (3) 아버지의 남동생 : 미혼(未婚) - 삼촌, 아저씨
                                 기혼(旣婚) - 작은아버지
   (4) 아버지의 동생의 아내 : 작은어머니
   (5) 아버지의 누이 : 고모, 아주머니
   (6) 아버지의 누이의 남편 : 고모부
   (7) 어머니의 남자 형제 : 외삼촌, 아저씨
   (8) 어머니의 남자 형제의 아내 : 외숙모, 아주머니
   (9) 어머니의 자매 : 이모, 아주머니
   (10) 어머니의 자매의 남편 : 이모부, 아저씨
   (11) 남형제의 아들 : 미성년(未成年) - ○○(이름)
                               성년(成年) - 조카, ○○ 아범, ○○ 아비
   (12) 남형제의 아들의 배우자 : (새) 아가, ○○ 어멈, ○○ 어미
   (13) 남형제의 딸 : 미성년 - ○○(이름)
                            성년 - 조카, ○○ 아범, ○○ 아비
   (14) 여형제의 자녀 : 남형제가 - 생질(甥姪), 생질녀
                               여형제가 - 이지(姨姪), 이질녀
                               미성년 - ○○(이름)
                               성년 - 조카, ○○ 아비, ○○ 어미

* 사촌끼리.
   (1) 아버지 남형제의 자녀 : 형님, 누님, 동새
   (2) 아버지 여형제의 자녀 : 고종, 고종사촌, 내종, 내종사촌, 형님, 누님, 동생
   (3) 어머니 여형제의 자녀 : 이종, 이종사촌, 형님, 누님, 동생

* 사돈간의 호칭.
   (1) 사돈끼리(며느리, 사위의 부모, 삼촌)
     ① 바깥사돈끼리 : 사돈
     ② 안사돈끼리 : 사부인(査夫人), 사돈
     ③ 바깥사돈 --> 안사돈 : 사부인
     ④ 안사돈 --> 바깥사돈 : 사돈어른
   (2) 위 항렬에게 : 사장어른
   (3) 아래 항렬에게 또는 아래 항렬끼리
      ① 남자에게 : 사돈, 사돈도령, 사돈총각
      ② 여자에게 : 사돈, 사돈아가씨, 사돈처녀

* 직장 내 호칭.
   (1) 동료끼리(직함이 있건 없건)
        000(00) 씨, 선생님, 0 선생님, 000 선생(님) , 0 선배, (00) 언니, 0(000) 여사
   (2) 상사
      ① 직함이 있을 때 : 부장님, 0(000) 부장님, (총무) 부장님
      ② 직함이 없을 때 : 선생님, 0(000) 선생님, 0(000) 선배님, 0(000) 여사 (00) 언니
   (3) 아래 직원
     ① 직함이 있을 때 : 0 과장,(총무) 과장, 000 씨, 0 형, 0 선생님, 00 선생
     ② 직함이 없을 때 : 00 씨, 0 형, 0 선생(님), 0(00) 여사, 0 군, 0 양

* 친구의 아내 : 아주머니, 0(00)씨, 00 어머니, 부인, 0 여사

* 친구의 남편 : (0) 00 씨, 00 아버지, (0) 과장님, (0) 선생님

* 남편의 친구 : (0) 00 씨, 00 아버지, (0) 과장님, (0, 000) 선생님

* 아내의 친구 : (0) 00 씨, 00 어미니, 아주머니, 0 선생(님), 0 과장님, 0 여사(님)

* 아버지의 친구.
   (1) 어린이말 : (지역 이름) 아저씨, 00 아버지
   (2) 어른말 : (지역 이름) 아저씨, 어르신, 선생님, (0) 과장님

* 어머니의 친구.
  (1) 어린이말 : (지역 이름) 아주머니, 00 어머니(엄마)
   (2) 어른말 : (지역 이름) 아주머니, 00 어머니

* 친구의 아버지.
   (1) 어린이말 : 00 아버지, (지역 이름) 아저씨
   (2) 어른말 : 00 아버님, 어르신, 00 할아버지

* 친구의 어머니.
   (1) 어린이말 : 00 어머니(엄마), (지역 이름) 아주머니
   (2) 어른말 : 00 어머님, 아주머님, 00 할머니

* 남선생님의 아내 : 사모님

* 여선생님의 남편 : 사부님, (0, 000) 선생님, 과장님

* 직장 상사의 가족.
   (1) 부인 : 사모님, 아주머니(님)
   (2) 남편 : (0, 000) 선생(님), (0, 000) 과장(님)
   (3) 자녀 : 00 (이름), 000 씨, (0) 과장(님)

신고

'유용한 자료 모음' 카테고리의 다른 글

유용한 자료 모음  (0) 2009.12.10
가족 친척간 호칭 정리  (2) 2009.10.25
by 에이아이 2009.10.25 14:45

출처 : Seri.org

내용 : 166 페이지에 달하는 방대하고 자세한 내용과 예제.

1. 시작하기.
2. 표현하는 방법
3.질문에 답변하는 방법
4. 마무리하는 방법.



추가로 발표자료 만들때 참고할 만한 자료


신고
by 에이아이 2009.10.16 20:14

F-검정에 대해서 공부해보자.
몇 결정트리 알고리즘에서 t-검정, F검정을 사용하기 때문에
해당 결정트리 알고리즘을 잘 이해하기 위해서는 이러한 통계 검정 방법들을 잘 이해해두어야 한다.

F-검정은 언제 사용할까?
F-검정은 두 모집단의 분산의 차이가 있는가를 검정할 때 사용한다.
(두 집단의 평균의 차이가 존재하는가가 아니라 분산의 차이가 있는가를 검정한다.)

F-검정의 특징
F-검정값은 항상 1보다 같거나 크다. (두 표본집단의 분산 값을 나눈 것이므로, 큰 것이 분모, 작은 것이 분자)
F값이 클수록 두 집단간의 분산의 차이가 존재하는 것을 의미한다.

예1. (제4판. 현대통계학. p.349-350)
예를들어, 어느 중학교에서 1학년 학생들의 성적의 차이(분산)이 2학년이 되면 더 커질 것이라고 예상된다. 실제로 그런가 검정해보자. 1학년에서 7명을 뽑고, 2학년에서 9명을 뽑아서 각각의 성적의 분산을 조사해 봤더니, 1학년의 분산은 9.0 이었고, 2학년의 분산은 19.8 이었다. 두 모집단의 분산은 같다고 볼 수 있을까? 알파=0.05 에서 검정해보자.
F(8,6) = 4.15 이다. (자유도는 개체 크기에서 1씨 뺀 값으며 2개가 사용된다. F분포표에서 찾아보자.)
F = 19.8 / 9 = 2.2 이다. 2.2 < 4.15 이므로 F=2.2는 기각역 안에 있으며, 귀무가설을 기각할 수 없다.
즉, 2학년학생의 성적 차이가 1학년 학생의 성적차이보다 크다고 할 수 없다.  

F-분포표

F검정에 필요한 F분포표를 첨부하였다.
F검정표는 두 개의 자유도 값을 사용한다. (행, 열에 두 표본의 자유도가 사용된다.)



참고자료
[1] 제4판 현대통계학, 박정식/윤영선. p.335- (15장)

신고
by 에이아이 2009.10.14 18:45

정리 중인 자료입니다.

참고자료

[제4판] 현대통계학 (박정식, 윤영선) 13장. (p.293-)
에듀팜 [SPSS기초] 17장-27장


t-검정은 언제 사용하는가?


모집단의 평균을 알고 있고,
표본의 평균과 분산을 알고 있을 때
표본의 평균이 표본의 평균과 같은가 다른 가를 검정하는 것.

예를 들어보자.

예제1.
일본 초등학생들의 IQ 평균이 105라고 하자. 한국의 100명의 초등학생들을 표본으로 IQ를 검사해보니 평균이 110이 나왔다. 그러면 한국의 초등학생들이 일본 초등학생보다 IQ가 높다고 결론 내릴 수 있는가? (이 결론을 내리기 위해서는 사실 100명의 표본 초등학생에 대한 분산 정보가 필요하다.)

예제2.
2000년대 한국 고3학생들의 키가 165cm 였다고 하자. 최근(2009년) 고3학생 200명을 표본으로 키를 측정해보니 평균이 170cm 가 나왔다. 그러면 학생들의 키가 이전보다 증가되었다고 결론을 내릴 수 있는가?


t-검정 검정 방법

간단하게 t-검정을 하는 방법을 설명한다.
표본에 대하여 t-검정 통계량 값을 계산한다. (-4에서 4정도 사이의 값을 얻게 된다.)
그 값이 t-분포의 그래프의 양 끝 쪽에 속할 수록 모집단과 평균이 다르다는 것을 보여준다.
지정한 유의확률(%)을 가지고 유의값을 선정하여 검정할 수 있다.


좀 더 자세하게 t-검정을 분류해 볼 수 있다. 

*  1표본 t-검정 (또는 일표본 t-검정)
*  독립 2표본 t-검정
*  대응 2표본 t-검정
 
위의 예제1, 예제2는 모두 1표본 t-검정에 속하는 예이다.


독립 2표본 t-검정이란?

위에서 t-검정은 모집단의 분포를 모르고, 표본 집단에서의 분포(평균, 분산)을 아는 상황인 것을 기억하자. 
독립 2표본 t-검정이란 2개의 표본을 추출한 후 이 두개 집단의 분포(평균, 분산) 정보를 이용하여 두 표본의 모집단에 차이가 있는지를 검정하는 것이다. 

예를 들어, 한국 고3학생 100명의 키를 측정하고, 일본 고3학생 100명의 키를 측정한 후 이 표본 데이터를 기초로하여, 한국, 일본 고3학생의 키에 차이가 있는가에 대한 결론을 얻고 싶을 때 독립 2표본 t-검정을 수행한다.  


대응 2표본 t-검정

한 개체에게서 2회의 반응값을 얻은 경우 그 차이가 존재하는 가를 검정한다. 즉, 한 개체에 대하여
이름에서 [대응]은 짝(Pair)를 의미한다.
다시 말하면, 두번의 반복측정에서 얻어진 결과가 차이가 있는 지를 비교한다.
두 모집단의 원자료를 각각 요약하는 것이 아니라 대신 차이값의 자료를 얻고자 한다.

예를들어, 새로 개발된 간수치안정제가 효과가 있는지를 검정한다고 해보자. 10명의 환자에 대하여 개발된 약을 먹기 전과 후의 간 수치를 측정한다. 이 실험 값을 토대로 하여 간의 수치를 개선하는 효과가 있는 지를 검정한다. (이 실험에서 한 사람에 대하여 2개의 값이 쌍으로의 성격을 갖는다.)

비슷한 예로, 감기약을 먹기 전과 후의 몸의 열의 변화가 생기는지를 검정한다고 하자. 10명의 환자에 대하여 먹기 전과 먹은 후의 값(쌍, 대응)들을 얻는다.

다른 예로, A사건이 발생하기 이전과 이후의 특정 당(한나라당)에 대한 지지율의 변화가 발생했는 지를 검정한다고 해보자. 100명의 사람을 대상으로 하여 A사건 이전의 한나라당에 대한 지지율과 A사건 발생 후의 한나라당에 대한 지지율을 측정한다.

다른 예로, 어떤 교육단체에서 독서를 통한 심리안정 치료 방법을 개발했다고 하자. 100명의 정서장애자들에게 대하여 교육을 받기 전과 받은 후의 정서장애 정도를 측정한다.  

-----------------------------

그럼, t-검정과 Z-검정의 차이를 살펴보자.

Z검정은 모집단의 평균과 분산을 모두 알고 있을 때, 어떤 레코드 또는 표본 집단이 모집단에 속하는가를 검정하는 것이다. 즉, t-검정은 모집단의 평균을 알지만 분산은 모른다는 점에서 차이가 있다.

모집단의 분산을 모르기 때문에 레코드들이 Z-분포를 한다고 말할 수 없다.
따라서 그러한 경우 t-분포를 따른다고 할 수 있다. (t-분포는 정규분포와 유사한 모양을 갖지만, 더 넓게 펼쳐진다는 차이가 있으며, 그 정도는 표본집단의 분산과 레코드의 개수를 가지고 결정된다.)

Z-분포와 t-분포의 차이를 살펴보자.
Z-분포는 모집단의 평균과 분산을 알고 있을 때의 정규분포를 의미한다.
반면, t-분포는 표본집단의 평균과 분산, 그리고 자료(레코드) 수를 알고 있을 때의 분포를 의미한다.

Z-분포 ----> 정규분포를 따른다.
t-분포 ----> 자유도가 (n-1)인 t-분포를 따른다.


사용자 삽입 이미지



신고
by 에이아이 2009.10.11 21:26

참고1 : http://hoksi.com/Standard_Normal_Distribution_Table.htm
참고2 : http://www.statsoft.com/textbook/sttable.html#z

정규분포에 대한 개념 설명 : http://tong.nate.com/jinkwan5/49693374
표준정규분포에 대한 설명 : http://blog.naver.com/at3650?Redirect=Log&logNo=40066177242
6 Sigma : http://blog.naver.com/noijws?Redirect=Log&logNo=130035107783

엑셀로 만든 표준정규분포표

사용자 삽입 이미지

위의 표는 중앙을 기준으로 했을 때의 너비를 가지고 작성한 표입니다.

반면 아래와 같이 좌측 끝을 기준으로 했을 때의 너비를 가지고 작성한 표의 내용입니다.

사용자 삽입 이미지


신고
by 에이아이 2009.10.11 18:51
| 1 2 3 4 5 6 7 ··· 31 |