간단한 통계 및 데이터마이닝 분석을 연습할 때 사용할 수 있는
학생들 성적에 대한 가상 데이터입니다.
간단한 통계분석, 예를 들어, 상관분석, 회귀분석, 경로분석 등을 실습할 때 간단하게 사용할 수 있습니다.

수치형 변수로만 구성된 데이터입니다.
파일의 내용은 바로 아래 그림에 표시하였습니다.







범주형 변수도 포함된 데이터입니다.
파일의 내용은 바로 아래 그림에 표시하였습니다.





by 에이아이 2009. 12. 8. 17:25
이 데이터는 경로분석의 개념을 설명하기 위해 만들어진 가상 데이터입니다.
파일은 아래에 첨부하였고, 자세한 데이터의 내용은 그 아래에 설명합니다.


파일의 내용은 아래와 같습니다.


데이터의 내용을 설명하도록 하겠습니다.

A자동차 회사가 자사에 대한 고객들의 충성도를 평가하기 위하여 설문조사를 하고자 합시다.
좀 더 자세하게는 고객들의 자사 제품(자동차)에 대한 가격만족도, 품질만족도, 브랜드태도 등이 회사에 대한 충성도에 어떻게 영향을 미치는 가를 평가하기 위하여 설문을 수행합니다.

A자동차 회사의 자동차를 이미 구매하여 사용하고 있는 8명의 고객에 대하여 설문을 받았습니다.

설문조사지의 내용은 아래와 같습니다.

1. 가격 : A사의 자동차는 가격이 적절하다고 느끼십니까?  
  (1-매우저렴 / 2-저렴 / 3-적절 / 4-비싸다 / 5-매우비싸다)

2. 품질 : A사의 자동차에 대한 품질에 만족하십니까?
  (1-매우불만족 / 4-불만족 / 3-보통 / 4-만족 / 5-매우만족)

3. 디자인 : A사의 자동차의 디자인에 만족하십니까?
  (1-매우불만족 / 4-불만족 / 3-보통 / 4-만족 / 5-매우만족)

4. 브랜드태도 : 당신은 A사의 자동차가 좋다고 느끼십니까? 
  (1-매우불만족 / 4-불만족 / 3-보통 / 4-만족 / 5-매우만족)

5. 브랜드충성도 : 당신은 A사의 자동차를 다시 구매하고 싶으십니까? 
  (1-절대안산다 / 4-안산다 / 3-보통 / 4-사고싶다 / 5-꼭다시살것이다.)

참고자료.
[1] 구조방정식 모형분석과 AMOS 16.0 이학식, 임지훈 저

위 교재의 <9장. 분석예제와 결과물 해석> p.146- 에 위 데이터에 대한 소개와 이 데이터를 사용한 분석 방법이 자세히 소개되어 있습니다.





by 에이아이 2009. 12. 6. 01:03

통계를 공부한 후에 검증할 겸 자격증 시험에 응시해봐도 좋을 것 같습니다.
보통 통계학을 전공하는 분들이 많이 취득하는 자격증이라고 합니다. 그러나 사회현상을 분석하는 작업은 많은 분야에서 필요로 하는 기술이기 때문에 꼭 통계학을 전공하지 않았더라도 취득하는 것이 많은 도움이 될 거라고 생각합니다. 

사회조사분석사 2급
http://www.q-net.or.kr/crf005.do?id=crf00503s01&gSite=Q&gId=&jmCd=9521&jmInfoDivCcd=A0

사회조사분석사 1급
http://www.q-net.or.kr/crf005.do?id=crf00503s01&gSite=Q&gId=&jmCd=9520&jmInfoDivCcd=A0


사회조사분석사 자격증 소개 동영상 
 

에듀팜에서 제공하는 <자격증 소개> 동영상
(1강 자격증 소개는 무료 강좌입니다. 자격증에 대한 자세한 소개를 들을 수 있습니다.)
http://www.edufam.co.kr/ylec/lec_list3.php?code=486711942#1


접수 및 시험 일정 (2009년 참고)

(대략 2월, 4월, 7월, 8월 정도에 접수를 받음)



자세한 내용을 확인하려면

(1)  http://www.q-net.or.kr/  사이트에 방문한 후
(2) 좌측의 메뉴에서 [시험접수] - [시험일정] 을 클릭한 후
(2) 새로운 화면의 좌측 메뉴에서 [국가자격] - [국가자격 종목별 상세정보] 클릭한 후
(3) 중앙에서 [전문사무] 범주 버튼을 클릭한다.

이제 해당 자격증에 대한 시험내용, 시험일자, 접수방법등을 확인할 수 있습니다.

기출문제

[1] 2급 기출문제 풀이 글
[2] 기출문제 압축 파일 (2급 필기시험)
by 에이아이 2009. 12. 5. 10:26

데이터명 : Boston Housing Price (보스턴 주택 가격 데이터)
레코드수 : 506 개
필드개수 :  14 개

데이터설명 : 보스턴 시의 주택 가격에 대한 데이터이다.
주택의 여러가진 요건들과 주택의 가격 정보가 포함되어 있다. 주택의 가격에 영향을 미치는 요소를 분석하고자 하는 목적으로 사용될 수 있다. 회귀분석 등의 분석에 활용될 수 있다.

보스턴 주택 데이터는 여러 개의 측정지표들 (예를 들어, 범죄율, 학생/교사 비율 등)을 포함한, 보스턴 인근의 주택 가격의 중앙값(median value)이다. 이 데이터 집합은 14개의 변수를 포함하고 있다.

필드의 이해 :
데이터의 이해를 돕기 위해 포함된 14개의 변수에 대하여 간략하게 설명한다.  
위 14개의 필드는 입력 변수로 사용되고, 맨 아래의 Play 속성이 목표(종속) 변수로 사용된다.

 [01]  CRIM 자치시(town) 별 1인당 범죄율
 [02]  ZN 25,000 평방피트를 초과하는 거주지역의 비율
 [03]  INDUS 비소매상업지역이 점유하고 있는 토지의 비율
 [04]  CHAS 찰스강에 대한 더미변수(강의 경계에 위치한 경우는 1, 아니면 0)
 [05]  NOX 10ppm 당 농축 일산화질소
 [06]  RM 주택 1가구당 평균 방의 개수
 [07]  AGE 1940년 이전에 건축된 소유주택의 비율
 [08]  DIS 5개의 보스턴 직업센터까지의 접근성 지수
 [09]  RAD 방사형 도로까지의 접근성 지수
 [10]  TAX 10,000 달러 당 재산세율
 [11]  PTRATIO 자치시(town)별 학생/교사 비율
 [12]  B 1000(Bk-0.63)^2, 여기서 Bk는 자치시별 흑인의 비율을 말함.
 [13]  LSTAT 모집단의 하위계층의 비율(%)
 [14]  MEDV 본인 소유의 주택가격(중앙값) (단위: $1,000)


데이터파일

(1) 엑셀 파일 (*.xls)

 

(2) SPSS 파일 (*.sav)

 

데이터보기

아래 그림을 클릭하면 확대하여 볼 수 있습니다.
전체 506 개의 레코드 중에서 일부만 표시한 것입니다.



참고자료
[1] 비즈니스 인텔리젼스를 위한 데이터마이닝, 사이텍미디어, 신택수, 홍태호 역 ( p33 )

by 에이아이 2009. 12. 3. 23:23
본 글에서는 SPSS를 이용하여 단순 회귀분석을 수행하는 방법을 설명하고자 합니다.

회귀분석은 여러 변수 사이의 함수식(회귀식)을 구하는 분석 방법입니다.
예를 들어, 키와 몸무게의 관계를 함수식으로 표현하는 것인데
키를 X, 몸무게를 Y로 할 때, (즉, 키를 입력변수, 몸무게를 종속변수로 설정할 때)
Y = 1.1 * X -100 과 같이 두 변수의 관계를 나타내는 함수를 계산하는 것입니다.

단순회귀분석
입력변수가 1개, 종속변수가 1개인 형태의 회귀식을 계산하는 방법이고,
다중회귀분석
입력변수가 2개 이상, 종속변수가 1개인 형태의 회귀식을 계산하는 방법입니다.

학생들의 체력검사에 대한 가상 데이터를 가지고
SPSS 에서 단순 회귀분석을 수행하는 방법을 연습해보도록 하겠습니다. 
데이터는 아래의 글을 클릭하면 확인 및 다운로드 할 수 있습니다. 

예제 데이터 (체력검사.sav) 설명 및 다운로드 

자료를 다운로드 한 후 더블클릭하면 SPSS 프로그램이 실행됩니다.

분석을 위해서
메뉴에서 [분석] - [회귀분석] - [선형...] 을 클릭합니다.



아래와 같이 회귀분석을 위한 옵션을 설정합니다.

종속변수에 [체중]을 입력하고, 독립변수에 [신장] 을 입력합니다. (두 개가 바뀌지 않도록 주의하세요.)
[통계량] 버튼을 누르면 오른쪽 창이 나타나는데 원하는 정보들을 체크한 후 [계속] 버튼 클릭합니다.
[확인] 버튼을 누르면 분석이 시작됩니다.




분석이 완료되면 아래와 같이 분석된 결과를 확인할 수 있습니다.

[계수] 분석 표를 통해서
회귀식이 Y = 1.075 * X -116.838 인 것을 확인할 수 있습니다.

[모형 요약] 분석 표를 통해서
R, R제곱, 수정된 R제곱 값을 확인할 수 있습니다. 이 값들은 약간의 차이가 있지만 간단하게 말하면 회귀식의 모형의 적합도를 의미합니다. 회귀식이 얼마나 정확하게 Y값을 예측하는 가 에 대한 값입니다.
R값만 보자면 0 에서 1 사이의 값을 갖는데 1에 가까울 수록 적합도가 높은 것을 의미합니다. 
본 분석의 경우 0.77 이므로 상당히 모형의 적합도가 높다는 것, 즉 회귀식의 정확도가 높다는 것을 의미합니다.  

공선성(다중공선성)에 대한 값도 확인할 수 있습니다. 다중공선성은 입력변수들 간의 상관관계가 얼마나 강한가 에 대한 분석결과입니다. 본 분석에서는 입력변수가 1개 뿐이므로 공선성 진단은 아무 의미가 없으나 이러한 옵션이 있다는 것을 확인하기 위해 선택하여 확인해 보았습니다.




이것으로 SPSS 에서 단순 회귀분석을 수행하는 방법의 설명을 마치도록 하겠습니다. 

수고하셨습니다.^^  

추가자료

보너스로 인터넷에 공개된 단순회귀분석에 대한 동영상 자료를 첨부했습니다.
어떤 분이 회귀분석과 SPSS에서의 사용방법을 설명한 자료입니다.


http://www.mgoon.com/mystation/folder.htm?id=10846180&folder=11569866
by 에이아이 2009. 12. 3. 12:51
간단한 SPSS 및 AMOS 프로그램의 실습에 사용할 수 있는 데이터입니다.

학생들의 체력검사에 관련된 가상 데이터로써
이해하기 쉬워 간단한 분석을 실습해 볼 때 사용하기 적합합니다.

데이터 다운로드 받기

아래의 [체력검사.sav] 파일을 클릭하여 다운로드 할 수 있습니다.


데이터 설명

필드(칼럼) 수  :    6개
레코드 수       :   25개

데이터 보기






by 에이아이 2009. 12. 3. 00:18

본 글에서는 편 편상관계수를 분석하는 방법에 대해서 배워보겠습니다.

편상관계수 분석은 우리가 익히 알고 있는 상관관계 (피어슨 상관계수) 분석과 거의 동일합니다.
단, 2변수 이외에 관련된 1개의 변수의 영향을 제거했을 때의 2개 변수 간의 순수한 상관관계를 분석하는 방법입니다.

메뉴에서 [분석] - [상관분석] - [편상관계수] 을 클릭합니다.



설정 창이 나타나면 아래와 같이 설정합니다.



잠깐 기다리면 아래와 같이 분석 결과가 나타납니다.
[성별] 이 통제 변수로 설정된 것을 확인할 수 있습니다.

신장(키)와 체중(몸무게)의 상관계수 값이 0.638 로 계산된 것을 확인할 수 있습니다.



그럼 위의 편상관계수 분석 결과와
(성별을 통제 변수로 사용하지 않은) 원래의 상관계수 분석결과를 비교해 보겠습니다.

아래는 원래의 기본적인 상관계수 분석 결과 화면입니다.

간단히 비교해보면 원래의 상관계수는 0.77 이고 유의도(0.000) 으로 매우 상관관계가 높은 것으로 분석되나,
성별을 통제변수로 설정한 편상관계수는 0.638 이고 유의도 (0.001) 으로 상관관계가 상대적으로 낮은 것을 볼 수 있습니다.



이것으로 SPSS에서 편상관계수를 계산하는 방법을 공부하였습니다.
우선 편상관계수를 측정하는 방법 중심으로 설명하였고 필요한 개념적인 설명은 차후 추가하도록 하겠습니다.

수고하셨습니다^^.

관련자료.
[1] 이훈영 교수의 SPSS를 이용한 데이터분석. (p.104-p.108)
by 에이아이 2009. 12. 2. 23:45

SPSS 에서 주어진 데이터를 분석할 때
전체 데이터를 모두 사용하여 분석하지 않고,
그 중 일부의 데이터만을 선택하여 선택하는 방법을 설명하고자 합니다.

예를 들어,
(1) 성별이 [남자]인 사람들만을 선택하여 분석하거나,
(2) 나이가 [30세 이상]인 사람들만을 선택하여 분석하거나,
(3) 거주지가 [서울]이고, 성별이 [남성]이고, 나이가 [30세 이상]인 사람들을 (2개 이상의 조건 사용)

선택하여 분석하는 등 특정 조건에 맞는 레코드들만을 선택하여 분석에 이용하는 방법입니다.

아래의 학생들의 [체력검사] 데이터를 사용하여 설명하도록 하겠습니다.
함께 실습을 하기 원한다면 파일을 다운로드 하세요.


데이터를 간단히 살펴보면 아래와 같습니다.



메뉴에서 [데이터] - [케이스 선택] 을 클릭합니다.



케이스 선택 창이 표시됩니다.
[조건을 만족하는 케이스] 를 선택한 후, 그 아래 [조건] 버튼을 클릭합니다.



조건을 입력하는 창이 표시됩니다. 
[성별] 변수명을 선택한 후 오른쪽 창으로 이동시킵니다. 
아래의 = 버튼을 클릭한 후 성별=1 이라는 형식의 수식을 완성합니다. (직접 = 을 써도 상관없습니다.)
조건이 완성되었으면 아래의 [계속] 버튼을 클릭합니다.



이전 창으로 돌아오면 하단의 [확인] 버튼을 누릅니다.

잠깐 기다리면 아래와 같이 SPSS 데이터 화면이 변경된 것을 확인할 수 있습니다.

맨 앞 컬럼의 레코드 번호에 선택되지 않은 (제거된) 레코드의 경우 줄이 그어져 있는 것을 확인할 수 있습니다. 그리고 filter_$ 라는 칼럼이 추가되었고, 선택된 레코드에는 1이, 선택되지 않은 레코드에는 0의 값이 입력된 것을 확인할 수 있습니다.



이제 상관관계 분석을 수행해보겠습니다.

메뉴에서 [분석] - [상관분석] - [이변량 상관분석] 을 클릭합니다.



아래와 같이 분석 내용을 설정한 후 [확인] 버튼을 누릅니다.



잠시 기다리면 아래와 같이 성별이 남자 인 레코드들에 대한 분석 결과를 얻을 수 있습니다.



자~ 이것으로 특정 조건에 맞는 레코드(케이스)들을 선택 한 후 분석을 수행하는 방법을 연습해 보았습니다.

본 글에서는 간단한 조건 (성별=남) 만을 설명하였지만, 더 복잡한 조건을 사용하는 방법도 여러분이 충분히 응용할 수 있을 것이라 생각됩니다.

공부하느라 수고했습니다^^.

관련자료.
1. 마우스로 잡는 SPSS for Windows 14.0  (p.213) 저자: 우수명.


by 에이아이 2009. 12. 2. 23:11

SPSS 에서 데이터를 분석 할 때
주어진 데이터를 모두 한번에 분석에 사용하지 않고, 전체 데이터를 소그룹으로 분할하여
분석을 수행하는 방법을 설명하고자 합니다.

예를 들어,
학생들의 신체검사 데이터에서 [키][몸무게]와의 상관관계를 측정하는 경우
전체학생을 대상으로 분석하는 것이 아니라
[남학생][여학생] 을 나누어서 분석을 수행하는 방법입니다. 

원본 데이터에서 필요한 부분만을 남기고 나머지 부분만을 지우고 분석을 할 수도 있겠지만
이렇게 무식한 방법 말고 SPSS에서 지원하는 좀 고급스런(?) 방법을 사용해보겠습니다.

아래의 [신체검사] 데이터를 가지고 설명해보겠습니다.
함께 실습을 원한다면 파일을 다운로드 하세요.

파일의 내용은 아래와 같습니다.
(전체 25개의 레코드로 구성되어 있으나, 아래에는 5개의 레코드만 표시하였습니다.)


위 데이터에 보면 성별이 [남], [여] 가 아니라
1.00, 2.00 의 숫자가 들어가 있는데, 남자=1.00, 여자=2.00 으로 코드화 된 것입니다.

자, 이제 [남자], [여자] 그룹을 구분하여 상관관계(피어슨 상관계수) 분석을 수행해보도록 하겠습니다.

메뉴에서 [데이터] - [파일 분할] 을 선택합니다.



파일 분할 창이 나타납니다.
여기에서 [집단별 비교] 를 체크한 후, [성별] 변수명을 오른쪽의 [분할 집단변수] 영역으로 이동시킵니다.
[확인] 버튼을 클릭합니다.



잠시 기다리면 파일 분할 작업이 수행되고,
완료되면 아래와 같은 결과 창이 나타납니다.



위의 창은 [X] 버튼을 눌러 닫습니다.
그냥 열어둔 상태에서 본래의 SPSS 화면으로 돌아와 작업해도 상관없습니다.

메뉴에서 [분석] - [상관분석] - [이변량 상관계수] 을 클릭합니다.



잠시 기다리면
아래와 같이 성별로 구분하여 상관관계를 분석한 결과를 볼 수 있습니다.

남학생의 경우 신장과 체중의 피어슨 상관계수가 0.635 이고
여학생의 경우 신장과 체중의 피어슨 상관계수가 0.721 인 것을 확인할 수 있습니다.




이것으로 SPSS의 [파일 분할] 기능을 이용하여
데이터를 소단위로 구분하여 분석을 수행하는 방법을 연습해보았습니다.

실습해보니 그리 어려운 기능은 아닌 것 같습니다. 
알아두면 가끔 필요할 것 같은 유용한 기능이었습니다^^.  
by 에이아이 2009. 12. 2. 21:39


AMOS 프로그램은 SEM 즉, <구조적 방정식 모델> 분석을 위해 사용되는 프로그램입니다.

좀 간단하게 말하면, 데이터의 변수들 간의 관계를 다이어그램으로 도식화하고 그 변수들 간의 인과관계를 분석하는 프로그램입니다. 내부적으로는 회귀분석, 요인분석 등의 개념이 사용됩니다.

SPSS 홈페이지에서는 AMOS를 아래와 같이 설명하고 있습니다.
AMOS 프로그램은 분석모형설계에 회귀분석 또는 요인분석 보다 복잡한 분석이 요구될 때 구조방정식모형을 쉽게 분석해주는 도구이며, 간단한 아이콘 클릭과 설정으로 구조방정식 모형을 설계하고 편집하는 기능을 제공합니다.  

SPSS 홈페이지에 방문하신 후 [제품] - [평가판 다운로드] 에 가시면 평가판 프로그램을 온라인으로 다운로드 받으실 수 있습니다. 방문을 원하시면 바로가기 를 클릭하세요.

주소: http://www.spss.co.kr/trial/trial_main.asp 


또는 아래의 사이트에서 Student 버전을 다운로드 받을 수도 있습니다.
평가판의 경우 2주 정도의 사용기간 제한이 있는데 Student 버전의 경우 기간 제한이 없을 것 같습니다.
(확인해보지 않아서 정확히는 모르겠습니다.)

http://www.amosdevelopment.com/download/index.htm

그리고, 추가로 SPSS 홈페이지에서 제공하고 있는 AMOS 18.0 프로그램의 메뉴얼 PDF 파일을 첨부합니다.
약 650 페이지로 구성된 AMOS 사용법을 다루고 있는 자료입니다.

본사에서 제작된 자료이므로 프로그램의 사용법을 자세하게 다루고 있습니다. 필요한 내용이 있다면 자세히 살펴보면 다 나올 듯 합니다. 물론 영문이므로 영어가 좀 익숙하셔야 편할 것 같네요.

by 에이아이 2009. 11. 30. 21:34
| 1 2 3 4 5 6 ··· 31 |