본 글에서는 SPSS를 이용하여 단순 회귀분석을 수행하는 방법을 설명하고자 합니다.

회귀분석은 여러 변수 사이의 함수식(회귀식)을 구하는 분석 방법입니다.
예를 들어, 키와 몸무게의 관계를 함수식으로 표현하는 것인데
키를 X, 몸무게를 Y로 할 때, (즉, 키를 입력변수, 몸무게를 종속변수로 설정할 때)
Y = 1.1 * X -100 과 같이 두 변수의 관계를 나타내는 함수를 계산하는 것입니다.

단순회귀분석
입력변수가 1개, 종속변수가 1개인 형태의 회귀식을 계산하는 방법이고,
다중회귀분석
입력변수가 2개 이상, 종속변수가 1개인 형태의 회귀식을 계산하는 방법입니다.

학생들의 체력검사에 대한 가상 데이터를 가지고
SPSS 에서 단순 회귀분석을 수행하는 방법을 연습해보도록 하겠습니다. 
데이터는 아래의 글을 클릭하면 확인 및 다운로드 할 수 있습니다. 

예제 데이터 (체력검사.sav) 설명 및 다운로드 

자료를 다운로드 한 후 더블클릭하면 SPSS 프로그램이 실행됩니다.

분석을 위해서
메뉴에서 [분석] - [회귀분석] - [선형...] 을 클릭합니다.



아래와 같이 회귀분석을 위한 옵션을 설정합니다.

종속변수에 [체중]을 입력하고, 독립변수에 [신장] 을 입력합니다. (두 개가 바뀌지 않도록 주의하세요.)
[통계량] 버튼을 누르면 오른쪽 창이 나타나는데 원하는 정보들을 체크한 후 [계속] 버튼 클릭합니다.
[확인] 버튼을 누르면 분석이 시작됩니다.




분석이 완료되면 아래와 같이 분석된 결과를 확인할 수 있습니다.

[계수] 분석 표를 통해서
회귀식이 Y = 1.075 * X -116.838 인 것을 확인할 수 있습니다.

[모형 요약] 분석 표를 통해서
R, R제곱, 수정된 R제곱 값을 확인할 수 있습니다. 이 값들은 약간의 차이가 있지만 간단하게 말하면 회귀식의 모형의 적합도를 의미합니다. 회귀식이 얼마나 정확하게 Y값을 예측하는 가 에 대한 값입니다.
R값만 보자면 0 에서 1 사이의 값을 갖는데 1에 가까울 수록 적합도가 높은 것을 의미합니다. 
본 분석의 경우 0.77 이므로 상당히 모형의 적합도가 높다는 것, 즉 회귀식의 정확도가 높다는 것을 의미합니다.  

공선성(다중공선성)에 대한 값도 확인할 수 있습니다. 다중공선성은 입력변수들 간의 상관관계가 얼마나 강한가 에 대한 분석결과입니다. 본 분석에서는 입력변수가 1개 뿐이므로 공선성 진단은 아무 의미가 없으나 이러한 옵션이 있다는 것을 확인하기 위해 선택하여 확인해 보았습니다.




이것으로 SPSS 에서 단순 회귀분석을 수행하는 방법의 설명을 마치도록 하겠습니다. 

수고하셨습니다.^^  

추가자료

보너스로 인터넷에 공개된 단순회귀분석에 대한 동영상 자료를 첨부했습니다.
어떤 분이 회귀분석과 SPSS에서의 사용방법을 설명한 자료입니다.


http://www.mgoon.com/mystation/folder.htm?id=10846180&folder=11569866
by 에이아이 2009. 12. 3. 12:51
  • LEMON쿠우 2011.05.04 01:23 ADDR EDIT/DEL REPLY

    수정된 R제곱값이 0.575인데 베타값 0.77로 오타인거 같아용~~ > _< 뿌잉뿌잉 보통 모형의 설명력을 보려면 R값보다 R제곱값을 보지요??? 저게 막헷갈림...;

  • 2011.09.25 20:00 ADDR EDIT/DEL REPLY

    비밀댓글입니다