본 글에서는 SPSS를 사용하여 요인분석을 수행한 결과를 해석하는 방법에 대해서 설명한다.

만약 여러분이 SPSS 에서 해석하는 방법이 아니라,
SPSS 에서 요인 분석을 하는 방법, 절차를 알고 싶다면 여기 를 클릭하면 해당 글을 볼 수 있다. 
또는 요인분석이 무엇인지? 요인분석의 개념 및 이론이 궁금하다면 여기 를 클릭하면 해당 글을 볼 수 있다. 

분석 데이터의 설명

아래의 데이터를 SPSS 에 입력하여 요인분석을 수행하였다. 수행하는 방법(단계)은 이전 글 에서 설명하였으니 필요한 경우 참고하기 바란다.

우선 데이터를 다시 한번 살펴보자.
이해를 쉽게하기 위하여 간단한 예제 데이터를 사용하였다. 학생들의 성적데이터로써 [수학, 과학, 영어, 독어, 체육] 5과목의 시험 성적으로 구성되어 있다. 수학과 과학이 상관이 있으며, 영어와 독어가 관계가 있는 형태이다. 수리능력, 언어능력, 체력 의 3가지 요인으로 구성되었다는 것을 쉽게 생각할 수 있다.

   수학 과학  영어  독어  체육 
 학생1  90 100   30   40   80 
 학생2  80  90  80  90  40
 학생3  30  40  100  90  90
 학생4  40  45  30  40  60
 학생5  50  55  85  95  100

분석 결과의 예상

위 데이터에 대해서 요인분석을 수행하면 몇 개의 요인, 즉 잠재변수가 얻어질까?
이미 위에서 설명하였듯이 2개의 요인, 이름을 붙이자면 <수리계산능력>, <외국어능력> 이라는 2개의 요인이 도출될 것으로 예상된다. 체육 점수는 이 2개의 요인에 포함되지 않음으로 별도로 하나의 요인이 될 것이다. 그래서 정확히 말하면 데이터의 요인은 3개이다. 새롭게 만들어진 요인은 2개이다.


분석결과 화면

아래와 같은 분석 결과 화면을 볼 수 있다. 결과를 해석하는 것이 중요하다. 결과의 해석 또한 많은 설명이 필요하므로 다른 글을 통해서 설명해야 하겠다. 결과 파일을 아래에 첨부하였다.

주어진 데이터를 가지고 아래의 결과를 얻는 과정을 알고 싶다면 여기(SPSS 요인분석 절차) 를 클릭하자.




분석결과의 해석

전 단계에서 설명한 대로 세팅하고 실행하면 아래와 같은 분석들이 표시된다.
여기에서 가장 중요하게 보아야 할 것은

(1) 기술통계량

각 변수에 대한 평균, 표준편차의 기본 통계 정보를 표시한다.
요인분석과 밀접한 관계가 있는 분석은 분석에 앞서 이 정도의 간단한 통계는 살펴보는 것이 필요하겠다.



(2) 상관행렬

변수들간의 상관계수 값을 행렬로 표시한다. 대략 살펴보면, 수학과 과학이 0.996 으로 높은 상관성을 가지며, 영어와 독어가 0.967 로 높은 상관성을 가지는 것을 파악할 수 있다. 체육은 다른 과목들과 상관관계가 별로 없다. (우리가 이러한 의미로 데이터를 만들었기 때문에 이러한 결과는 당연하다.)

모든 변수들 간의 상관행렬을 구하고 싶다면 (SPSS 상관행렬 계산하는 별도의 메뉴는 없음으로)
이같이 요인분석의 옵션에서 상관행렬 을 체크하여 얻을 수 있다.  




(3) 공통성

공통성 표는 초기 값과 추출 값 두가지로 구성되어 있다.
초기는 항상 1이므로 별 의미는 없고, 추출 값만 보면된다. 추출 값은 0에서 1의 값을 갖는다.

추출 값의 의미는 무엇일까?
각 변수들이 나머지 다른 변수들에 얼마나 많이 영향을 받는가 (종속되어 있는가?) 를 측정한다.
각 변수에 대하여 너머지 변수들로 회귀분석을 수행했을 때 결정계수(R^2) 를 계산한 값이다. 따라서, 이 값이 1에 가까울 수록 다중공선성이 존재하고, 0에 가까울 수록 다중공선성의 정도가 없는 것으로 이해하면 된다.
즉, 각 변수의 다중공선성 수치 VIF 과 연관이 된다. (이미 알고있겠지만 다중공선성은 상관계수와 관계가 깊다. 물론 다중공선성과 상관계수는 차이가 있음으로 별도의 표로 계산한 것이다.) 

수학, 과학, 영어, 독어는 높은 값을 갖는 것을 볼 때 다중공선성이 크게 존재함을 알 수 있고,
체육의 경우는 0.356 이므로 다중공선성이 별로 없다고 판단할 수 있다.




(4) 설명된 총분산

표가 좀 복잡해서 무엇을 의미하는 지 파악이 힘들 수 있다.
잠재변수(요인)을 파악하기 위하여 주성분 분석을 사용했음이 표의 하단에 표시되어 있다.
주성분 분석을 사용하면 최대로 원래의 변수만큼의 주성분 즉, 요인을 찾을 수 있다. 이 데이터에서는 원래 변수가 5개 이므로 최대 주성분도 5개이다. (표의 왼편에 보면 성분이 1부터 5까지 되어있다.)

첫번째 칼럼(초기 고유값 중 전체)를 보자. 2.804, 1.414, ... 이 부분이다. 이 표에서 가장 중요한 부분이다.
모든 성분의 고유값의 합은 변수의 수와 같다. 즉, 여기서는 5가된다. 평균적으로 고유값은 1이다.
일반적으로 고유값이 1보다 크면 의미있는 요인으로 선택하게 된다.
(물론 이 기준은 분석가에 의도에 따라 변경될 수 있다. SPSS 옵션 창에서 변경 가능하다.)
따라서 여기서는 성분1, 성분2가 선택된다. 이 고유값은 해당 요인(잠재변수)의 중요성(설명력)의 정도를 의미한다. 즉, 각 성분(요인)의 주성분을 모든 고유값의 합(여기서는 5)으로 나누면 해당 변수의 전체 데이터에 대한 설명력 % 가 계산된다. 

즉, 1번째 성분(요인)은 2.804 / 5.0 = 0.451 (=45.1%) 로써 45%의 설명력을 가지고 
2번째 성분(요인)은 1.414 / 5.0 = 0.392 (=39.2%) 로써 39%의 설명력을 가진다. 

이 두 개의 새로운 성분만 사용해도 
전체 데이터의 84.367% 를 설명(예측)할 수 있음을 말해준다. 
계산식을 풀어쓰면 (2.804 + 1.414) / 5.0 = 0.84367 (=84.367%) 와 같다. 표의 맨 오른쪽에 누적 설명력(적재값)이 표시되고 있다. (적재값 이란 용어가 어색할 수 있는데 데이터에 대한 설명력[예측력]을 의미한다.) 
성분1과 성분2만 선택되었기 때문에 우측에는 두 개에 대해서만 값이 입력되어 있는 것이다.   




(5) 스크리 도표

스크리 도표를 사용하여 적절한 요인변수의 개수를 찾을 수 있다. 
실제 분석에서는 표를 보고 산정하는 것이 아니고, 고유값의 크기를 기준으로 산정하지만, 
스크리 도표는 사람이 직관적으로 적정한 요인수를 찾는데 도움을 준다. 

아래 그림에서보면 처음 2개의 요인 값의 고유값(Y축)이 1 이상의 값을 갖기 때문에 
2개를 선택하게 되는 것으로 판단할 수 있다. 기울기가 꺽이는 부분을 보고 선택하는 것이 아니고 Y축 값의 크기가 1 이상인가로 판단하는 것이다.  




(5) 성분행렬

이 부분이 중요하다.
몇 개의 인자들이 추출되었는지 알 수 있다. 그리고 이 인자들이 원변수들에 어느정도 영향을 받고 있는지 가중치를 보여준다. 이 부분을 잘 해석하는 것이 가장 중요한 관건이다.

요인적재량 계수가 나타난다.
3개의 인자를 끄집어 내고, 각 인자들이 원래의 변수들에 어느정도의 영향을 받고 있는지를 나타내는 수치(가중치)이다. * 이부분이 가장 중요한 부분이다. 이 수치가 의미가 있다.




(6) 회전된 성분행렬

(5)에서의 성분행렬 은 명확하게 구분하여 어렵다. 해석하기가 어렵다.
(5)를 이해하기 좋게 정렬하여 보여준다.



(7) 성분변환 행렬
고등학교 수학에서 배웠던 좌표 회전을 사용한 것이다. (고등학교 때 언제 배웠었지?? 기억이 전혀...)
베리맥스라는 방법을 썻다.



[8] 회전 공간의 성분 도표
3차원 좌표공간 상에 원래의 변수들을 점으로 표시한다.
<영어, 독어>가 가까운 위치에 존재하고, <수학, 과학>이 가까운 위치에 존재하는 것을 통해
영어, 독어가 유사한 의미를 가지며 하나의 요인(예를 들어, 언어적 능력)으로 묶일 수 있고,
수학, 과학이 유사한 의미를 가지며 하나의 요인(예를 들어, 수리계산 능력)으로 묶일 수 있음을 파악할 수 있다. 체육은 다른 과목들과의 연관성이 떨어지는 것도 파악할 수 있다.



[8] 성분점수 계수 행렬 

설명  



[8] 성분점수 공분산행렬

설명




추가내용

[고급분석 23장] 인자분석
 
인자분석 = 요인분석

목적1) 잠재변인을 찾는다. - 관측된 변수로부터 숨겨진 요인을 찾는다.
설문했을 때 이 설문이 몇 가지 특성을 측정하고 있는가? 검사한다.

설문지에 대한 정보가 없을 때
이 수 많은 항목들이 몇 개의 내용을 측정하고 있는가?
이에 포함되지 못하는 속성들을 제거하기 위해 사용된다.











by 에이아이 2009. 7. 27. 11:58
  • 이전 댓글 더보기
  • 김병영 2010.05.12 16:47 ADDR EDIT/DEL REPLY

    감사합니다. 좋은 정보 잘보고 갑니다.

  • ELLA 2010.05.16 14:30 ADDR EDIT/DEL REPLY

    감사합니다^^ 도움 많이 됬어요 히히

  • 박진수 2010.05.26 16:13 ADDR EDIT/DEL REPLY

    정말 명쾌하게 쓰셨네요. 도움 많이 됬습니ㅏㄷ.

  • kyjakim 2010.05.29 06:29 ADDR EDIT/DEL REPLY

    저도 잘 보고갑니다.
    자세히 알려주셔서 감사합니다.
    좀더 다른 해석을 볼수있었으면 하는데 안되나요?
    너무 욕심이 많나....

    • 에이아이 2010.05.29 11:08 신고 EDIT/DEL

      네, 안녕하세요^^.
      공부하면서 정리하는 겸 글을 썻었는데
      요즘은 다른 분야 연구로 바뻐서 통계는 공부를 못하고 있습니다.
      나중에 추가로 여러 분석들을 추가할 계획입니다.~

  • 박도희 2010.06.22 01:37 ADDR EDIT/DEL REPLY

    덕분에 너무 도움이 되었습니다 !!! 감사해요 ^_^ 최고예요 ~~~ 책내세용 !!

  • 블루 2010.07.08 14:13 ADDR EDIT/DEL REPLY

    논문쓰면서 막히는 부분이 있었는데 감사합니다. 설명이 너무 잘되어있네요.

  • vonzone 2010.12.11 21:00 신고 ADDR EDIT/DEL REPLY

    정말 훌륭한 글입니다. 많은 도움 되었어요...

  • unending 2011.07.11 13:35 ADDR EDIT/DEL REPLY

    책보다 설명이 훨씬~~ 쉽게 되어있어요..
    완전 감사해용

  • 하늘과 땅 그리고 바다 2011.07.14 14:31 ADDR EDIT/DEL REPLY

    통계에 대해 조금 맞을 보고 갑니다.
    가끔은 필요할 때 보고 갈수 있으면 좋겠습니다.

  • 다나에반스 2011.09.07 16:31 ADDR EDIT/DEL REPLY

    요인분석 돌리려고 이곳저곳 찾아보고 있었는데 너무 좋은 자료를 찾게되서 감사합니다.
    책을 봐도 도통 이해가 안됐는데! 올려주신 자료를 보니 한눈에 쏙~ 들어오네요^^ 감사합니다

  • 레오 2011.12.14 11:58 ADDR EDIT/DEL REPLY

    정말 감사합니다. 델파이 기법을 사용해서 요인도출하고 제 나름대로 5가지로 그룹핑을 했는데 그 그룹핑이 잘 되었는지 보려고 요인분석을 하려고 하는데, 전에 spss 강의를 한번 밖에 들은 적이 없어서요~ 기억도 가물가물하고 어떻게 해야하나 고민하고 있었는데 이곳에 와보니 도움이 많이 됩니다. 저 혼자서 할 수 있을 듯 합니다. 혹시 나중에 궁금한 것 있으면 여쭈어 봐도 되는지요? 위에 있는 글로만으로도 감사합니다~^^ 오늘 하루도 행복하세요~!!!

  • eileen 2012.02.16 00:42 ADDR EDIT/DEL REPLY

    통계 막막 했는데 희망이 마구마구 생기네요 ^^^^^^^^^^^^^^* 넘넘 감사드립니다 ♥

  • 마을숲 2012.03.19 17:50 ADDR EDIT/DEL REPLY

    글 잘보고 갑니다~ 너무 자세하게 써주셔서 아무것도 모르는 상황에서 많이 배웠습니다.
    그래도 아직 해결안된 부분이 있어서 선생님 같은분께 직접 여쭤보고 싶네요~^^

  • llld 2012.04.06 17:37 ADDR EDIT/DEL REPLY

    웬만해서는 답글 잘 안 다는데! 너무 많이 배워갑니다. 감사합니다!!!!!!!!

  • 스튜던뜨 2012.04.08 23:40 ADDR EDIT/DEL REPLY

    마케팅관리 배우면서 과제로 낑낑대고 있었는데
    너무 잘 보고 갑니다. 책을 봐도 막막했었는데 정말 감사합니다.

  • 정말 2012.06.20 14:03 ADDR EDIT/DEL REPLY

    저도 대학원생인데...독학으로..감사드립니다.

  • 치서니 2012.12.02 16:50 ADDR EDIT/DEL REPLY

    요인분석... 첨 시도해 보려고 하는데, 초보자인 제가 봐도 다 알것 같네요~
    너무 감사해요!

  • 나샤 2012.12.06 14:53 ADDR EDIT/DEL REPLY

    안녕하세요!
    SPSS 상에서 요인분석과 주성분분석의 차이가 너무 헷갈려 찾다가 여길 오게되었어요!
    너무 명확하고 깔끔한 설명에 몰랐던 부분을 많이 캐치해 갑니다. 감사해요!!

    그런데, 가장 중요한 '회전된 성분행렬'과 '성분점수 계수행렬'에 대한 해석을 써두질 않으셨네요.
    그게 너무 아쉬워요 ............ㅠㅠ 결국 그 표에서 나온 추정식을 구하기 위해 하는거잖아요~
    시간이 되신다면 그 부분에 대한 코멘트도 부탁드립니다!
    참고로 제 메일은 syunstions@hotmail.com 이에요!^^

  • 우래맨 2013.02.07 11:05 ADDR EDIT/DEL REPLY

    와우! 초보자인 제가 봐도 이해가 쏙쏙 잘 되는 것 같아요 고맙습니다^.^

  • 우왕 2013.10.13 14:32 ADDR EDIT/DEL REPLY

    이렇게 자세하게 나오다니!!! 감동입니다. ㅎㅎ