글
두 개의 범주형 변수 간의 관계(연관성)를 파악하는 방법을 설명한다.
몇 가지 활용 예
두 범주형 변수간의 연관성을 파악하는 것은 의미가 있다. 아래에 몇 가지 의미있는 예를 설명하였다.
[1] 성별에 따라 학력에 차이가 존재하는가?
[2] 흡연유무에 따라 얼굴 주름에 차이가 존재하는가?
분석 방법의 종류
두 범주형의 관계를 파악하는 분석 방법으로 아래의 2가지 방법을 사용할 수 있다.
[1] 교차분석표 분석 ( <--- 기술통계 방법 )
[2] 카이제곱 분석 ( <--- 추론통계 방법 )
이 글에서는 [1] 교차표 분석에 대해서 공부해보고자 한다.
SPSS에서 [분석] - [기술통계] - [교차표] 메뉴를 통해 이 기능을 지원하고 있다.
예제 데이터
먼저 분석에 사용할 예제 데이터를 살펴보자.
위의 그림을 변수들에 대한 정의를 표시하며, 아래 그림은 데이터의 값들을 보여주고 있다.
데이터 파일도 첨부하였다.
분석 방법
[분석] - [기술 통계] - [교차표] 메뉴를 사용하여 분석을 수행한다.
옵션의 설정
Row(행), Column(열) 에 분석하고자 하는 두 개의 변수명을 각각 입력한다. (범주형만 가능함)
결과 분석
결과는 상단에는 텍스트 중심의 표 분석이 나타나고,
하단에 차트 그림이 나타난다.
먼저 텍스트 중심의 표 분석을 살펴보자.
맨 상단의 표를 통해, 전체 25개의 레코드 중에서 1개의 레코드에 결측치가 존재하여, 나머지 24개를 사용하여 분석을 수행하였음을 표시하고 있다.
두번째 표를 살펴보면, 남성의 경우 중졸/고졸/대졸의 비율 분포가 20%/40%/40% 이고
여성의 경우 중졸/고절/대절의 분포 비율이 28.6%/42.9%/28.6% 임을 볼 수 있다.
이를 통해 성별에 따라 학력에 차이가 존재함을 확인할 수 있다.
아래의 차트 그림을 통해서
성별로 교육정도에 차이가 나타남을 시각적으로 확인할 수 있다.
높이를 보기보다는 (레코드의 개수는 중요하지 않기 때문에)
차트의 형태의 차이를 보는 것이 의미가 있다.
'스터디 자료' 카테고리의 다른 글
[참고] 베이지안 네트워크 원리 (참고자료) (1) | 2009.10.10 |
---|---|
[통계학] 카이제곱분포표 참고 (엑셀 함수 이용 방법 추가 : ChiInv ChiDist) (0) | 2009.10.09 |
[논문] FAB : 개인화 추천 시스템 (0) | 2009.09.24 |
[데이터마이닝 데이터] Weather 데이터 (날씨에 따른 운동경기 여부) (3) | 2009.09.17 |
매개효과를 발견하는 방법 (0) | 2009.09.13 |
RECENT COMMENT