본 글에서는 SPSS를 이용하여 단순 회귀분석을 수행하는 방법을 설명하고자 합니다.

회귀분석은 여러 변수 사이의 함수식(회귀식)을 구하는 분석 방법입니다.
예를 들어, 키와 몸무게의 관계를 함수식으로 표현하는 것인데
키를 X, 몸무게를 Y로 할 때, (즉, 키를 입력변수, 몸무게를 종속변수로 설정할 때)
Y = 1.1 * X -100 과 같이 두 변수의 관계를 나타내는 함수를 계산하는 것입니다.

단순회귀분석
입력변수가 1개, 종속변수가 1개인 형태의 회귀식을 계산하는 방법이고,
다중회귀분석
입력변수가 2개 이상, 종속변수가 1개인 형태의 회귀식을 계산하는 방법입니다.

학생들의 체력검사에 대한 가상 데이터를 가지고
SPSS 에서 단순 회귀분석을 수행하는 방법을 연습해보도록 하겠습니다. 
데이터는 아래의 글을 클릭하면 확인 및 다운로드 할 수 있습니다. 

예제 데이터 (체력검사.sav) 설명 및 다운로드 

자료를 다운로드 한 후 더블클릭하면 SPSS 프로그램이 실행됩니다.

분석을 위해서
메뉴에서 [분석] - [회귀분석] - [선형...] 을 클릭합니다.



아래와 같이 회귀분석을 위한 옵션을 설정합니다.

종속변수에 [체중]을 입력하고, 독립변수에 [신장] 을 입력합니다. (두 개가 바뀌지 않도록 주의하세요.)
[통계량] 버튼을 누르면 오른쪽 창이 나타나는데 원하는 정보들을 체크한 후 [계속] 버튼 클릭합니다.
[확인] 버튼을 누르면 분석이 시작됩니다.




분석이 완료되면 아래와 같이 분석된 결과를 확인할 수 있습니다.

[계수] 분석 표를 통해서
회귀식이 Y = 1.075 * X -116.838 인 것을 확인할 수 있습니다.

[모형 요약] 분석 표를 통해서
R, R제곱, 수정된 R제곱 값을 확인할 수 있습니다. 이 값들은 약간의 차이가 있지만 간단하게 말하면 회귀식의 모형의 적합도를 의미합니다. 회귀식이 얼마나 정확하게 Y값을 예측하는 가 에 대한 값입니다.
R값만 보자면 0 에서 1 사이의 값을 갖는데 1에 가까울 수록 적합도가 높은 것을 의미합니다. 
본 분석의 경우 0.77 이므로 상당히 모형의 적합도가 높다는 것, 즉 회귀식의 정확도가 높다는 것을 의미합니다.  

공선성(다중공선성)에 대한 값도 확인할 수 있습니다. 다중공선성은 입력변수들 간의 상관관계가 얼마나 강한가 에 대한 분석결과입니다. 본 분석에서는 입력변수가 1개 뿐이므로 공선성 진단은 아무 의미가 없으나 이러한 옵션이 있다는 것을 확인하기 위해 선택하여 확인해 보았습니다.




이것으로 SPSS 에서 단순 회귀분석을 수행하는 방법의 설명을 마치도록 하겠습니다. 

수고하셨습니다.^^  

추가자료

보너스로 인터넷에 공개된 단순회귀분석에 대한 동영상 자료를 첨부했습니다.
어떤 분이 회귀분석과 SPSS에서의 사용방법을 설명한 자료입니다.


http://www.mgoon.com/mystation/folder.htm?id=10846180&folder=11569866
by 에이아이 2009. 12. 3. 12:51
간단한 SPSS 및 AMOS 프로그램의 실습에 사용할 수 있는 데이터입니다.

학생들의 체력검사에 관련된 가상 데이터로써
이해하기 쉬워 간단한 분석을 실습해 볼 때 사용하기 적합합니다.

데이터 다운로드 받기

아래의 [체력검사.sav] 파일을 클릭하여 다운로드 할 수 있습니다.


데이터 설명

필드(칼럼) 수  :    6개
레코드 수       :   25개

데이터 보기






by 에이아이 2009. 12. 3. 00:18

본 글에서는 편 편상관계수를 분석하는 방법에 대해서 배워보겠습니다.

편상관계수 분석은 우리가 익히 알고 있는 상관관계 (피어슨 상관계수) 분석과 거의 동일합니다.
단, 2변수 이외에 관련된 1개의 변수의 영향을 제거했을 때의 2개 변수 간의 순수한 상관관계를 분석하는 방법입니다.

메뉴에서 [분석] - [상관분석] - [편상관계수] 을 클릭합니다.



설정 창이 나타나면 아래와 같이 설정합니다.



잠깐 기다리면 아래와 같이 분석 결과가 나타납니다.
[성별] 이 통제 변수로 설정된 것을 확인할 수 있습니다.

신장(키)와 체중(몸무게)의 상관계수 값이 0.638 로 계산된 것을 확인할 수 있습니다.



그럼 위의 편상관계수 분석 결과와
(성별을 통제 변수로 사용하지 않은) 원래의 상관계수 분석결과를 비교해 보겠습니다.

아래는 원래의 기본적인 상관계수 분석 결과 화면입니다.

간단히 비교해보면 원래의 상관계수는 0.77 이고 유의도(0.000) 으로 매우 상관관계가 높은 것으로 분석되나,
성별을 통제변수로 설정한 편상관계수는 0.638 이고 유의도 (0.001) 으로 상관관계가 상대적으로 낮은 것을 볼 수 있습니다.



이것으로 SPSS에서 편상관계수를 계산하는 방법을 공부하였습니다.
우선 편상관계수를 측정하는 방법 중심으로 설명하였고 필요한 개념적인 설명은 차후 추가하도록 하겠습니다.

수고하셨습니다^^.

관련자료.
[1] 이훈영 교수의 SPSS를 이용한 데이터분석. (p.104-p.108)
by 에이아이 2009. 12. 2. 23:45

SPSS 에서 주어진 데이터를 분석할 때
전체 데이터를 모두 사용하여 분석하지 않고,
그 중 일부의 데이터만을 선택하여 선택하는 방법을 설명하고자 합니다.

예를 들어,
(1) 성별이 [남자]인 사람들만을 선택하여 분석하거나,
(2) 나이가 [30세 이상]인 사람들만을 선택하여 분석하거나,
(3) 거주지가 [서울]이고, 성별이 [남성]이고, 나이가 [30세 이상]인 사람들을 (2개 이상의 조건 사용)

선택하여 분석하는 등 특정 조건에 맞는 레코드들만을 선택하여 분석에 이용하는 방법입니다.

아래의 학생들의 [체력검사] 데이터를 사용하여 설명하도록 하겠습니다.
함께 실습을 하기 원한다면 파일을 다운로드 하세요.


데이터를 간단히 살펴보면 아래와 같습니다.



메뉴에서 [데이터] - [케이스 선택] 을 클릭합니다.



케이스 선택 창이 표시됩니다.
[조건을 만족하는 케이스] 를 선택한 후, 그 아래 [조건] 버튼을 클릭합니다.



조건을 입력하는 창이 표시됩니다. 
[성별] 변수명을 선택한 후 오른쪽 창으로 이동시킵니다. 
아래의 = 버튼을 클릭한 후 성별=1 이라는 형식의 수식을 완성합니다. (직접 = 을 써도 상관없습니다.)
조건이 완성되었으면 아래의 [계속] 버튼을 클릭합니다.



이전 창으로 돌아오면 하단의 [확인] 버튼을 누릅니다.

잠깐 기다리면 아래와 같이 SPSS 데이터 화면이 변경된 것을 확인할 수 있습니다.

맨 앞 컬럼의 레코드 번호에 선택되지 않은 (제거된) 레코드의 경우 줄이 그어져 있는 것을 확인할 수 있습니다. 그리고 filter_$ 라는 칼럼이 추가되었고, 선택된 레코드에는 1이, 선택되지 않은 레코드에는 0의 값이 입력된 것을 확인할 수 있습니다.



이제 상관관계 분석을 수행해보겠습니다.

메뉴에서 [분석] - [상관분석] - [이변량 상관분석] 을 클릭합니다.



아래와 같이 분석 내용을 설정한 후 [확인] 버튼을 누릅니다.



잠시 기다리면 아래와 같이 성별이 남자 인 레코드들에 대한 분석 결과를 얻을 수 있습니다.



자~ 이것으로 특정 조건에 맞는 레코드(케이스)들을 선택 한 후 분석을 수행하는 방법을 연습해 보았습니다.

본 글에서는 간단한 조건 (성별=남) 만을 설명하였지만, 더 복잡한 조건을 사용하는 방법도 여러분이 충분히 응용할 수 있을 것이라 생각됩니다.

공부하느라 수고했습니다^^.

관련자료.
1. 마우스로 잡는 SPSS for Windows 14.0  (p.213) 저자: 우수명.


by 에이아이 2009. 12. 2. 23:11

SPSS 에서 데이터를 분석 할 때
주어진 데이터를 모두 한번에 분석에 사용하지 않고, 전체 데이터를 소그룹으로 분할하여
분석을 수행하는 방법을 설명하고자 합니다.

예를 들어,
학생들의 신체검사 데이터에서 [키][몸무게]와의 상관관계를 측정하는 경우
전체학생을 대상으로 분석하는 것이 아니라
[남학생][여학생] 을 나누어서 분석을 수행하는 방법입니다. 

원본 데이터에서 필요한 부분만을 남기고 나머지 부분만을 지우고 분석을 할 수도 있겠지만
이렇게 무식한 방법 말고 SPSS에서 지원하는 좀 고급스런(?) 방법을 사용해보겠습니다.

아래의 [신체검사] 데이터를 가지고 설명해보겠습니다.
함께 실습을 원한다면 파일을 다운로드 하세요.

파일의 내용은 아래와 같습니다.
(전체 25개의 레코드로 구성되어 있으나, 아래에는 5개의 레코드만 표시하였습니다.)


위 데이터에 보면 성별이 [남], [여] 가 아니라
1.00, 2.00 의 숫자가 들어가 있는데, 남자=1.00, 여자=2.00 으로 코드화 된 것입니다.

자, 이제 [남자], [여자] 그룹을 구분하여 상관관계(피어슨 상관계수) 분석을 수행해보도록 하겠습니다.

메뉴에서 [데이터] - [파일 분할] 을 선택합니다.



파일 분할 창이 나타납니다.
여기에서 [집단별 비교] 를 체크한 후, [성별] 변수명을 오른쪽의 [분할 집단변수] 영역으로 이동시킵니다.
[확인] 버튼을 클릭합니다.



잠시 기다리면 파일 분할 작업이 수행되고,
완료되면 아래와 같은 결과 창이 나타납니다.



위의 창은 [X] 버튼을 눌러 닫습니다.
그냥 열어둔 상태에서 본래의 SPSS 화면으로 돌아와 작업해도 상관없습니다.

메뉴에서 [분석] - [상관분석] - [이변량 상관계수] 을 클릭합니다.



잠시 기다리면
아래와 같이 성별로 구분하여 상관관계를 분석한 결과를 볼 수 있습니다.

남학생의 경우 신장과 체중의 피어슨 상관계수가 0.635 이고
여학생의 경우 신장과 체중의 피어슨 상관계수가 0.721 인 것을 확인할 수 있습니다.




이것으로 SPSS의 [파일 분할] 기능을 이용하여
데이터를 소단위로 구분하여 분석을 수행하는 방법을 연습해보았습니다.

실습해보니 그리 어려운 기능은 아닌 것 같습니다. 
알아두면 가끔 필요할 것 같은 유용한 기능이었습니다^^.  
by 에이아이 2009. 12. 2. 21:39
| 1 2 |