[*] Data Mining for Intelligence (비지니스 인텔리전스를 위한 데이터마이닝) 교재의 예제 데이터셋 웹사이트 http://www.dataminingbook.com/datasets (id: wskim92, passwd: 6BkkVSW6Dj 로 로그인 할 것)
데이터설명 : 날씨에 따른 운동경기 여부를 기록한 데이터이다. 이 데이터를 분석하면 어떤 날씨에 운동을 하는가에 대한 결정 기준을 분석할 수 있다. 데이터마이닝의 분류 기법, 특히 ID3, C4.5, C5.0, CART, CHAID 등의 의사결정트리에 대한 기초 개념, 동작원리를 설명할 때 많이 사용되는 데이터이다. 레코드 개수도 많지 않고 데이터를 이해하는데 어렵지 않다. 처음 데이터마이닝 실습을 해볼 때 사용하면 좋은 데이터이다.
필드의 이해 :
데이터의 이해를 돕기 위해 포함된 5개의 변수에 대하여 간략하게 설명한다.
위 4개의 필드는 입력 변수로 사용되고, 맨 아래의 Play 속성이 목표(종속) 변수로 사용된다.
Outlook
조망(전반적 날씨) 정보이다. Sunny(맑은), Overcast(구름낀), Rainy(비오는) 의 3개의 값을 갖는다.
Temperature
기온(온도) 정보이다. 데이터에서는 섭씨 온도로 표시되어 있다. 수치형 변수이며, 범주형으로 변환된 경우 hot, mild, cool 의 3개의 값으로 입력된다.
Humidity
습도 정보이다. 수치형 변수이며, 범주형으로 변환된 경우 high, normal 2개의 값으로 입력된다.
Windy
풍량 정보이다. TRUE(바람 붐), FALSE(바람 안붐)의 2개의 값 중 입력된다.
Play
운동경기 여부이다. TRUE(경기함), FALSE(경기안함)의 2개의 값 중 입력된다.
데이터 테이블
[1] 원본 데이터 형태
Outlook
temperature
humidity
windy
play
sunny
85
85
FALSE
no
sunny
80
90
TRUE
no
overcast
83
86
FALSE
yes
rainy
70
96
FALSE
yes
rainy
68
80
FALSE
yes
rainy
65
70
TRUE
no
overcast
64
65
TRUE
yes
sunny
72
95
FALSE
no
sunny
69
70
FALSE
yes
rainy
75
80
FALSE
yes
sunny
75
70
TRUE
yes
overcast
72
90
TRUE
yes
overcast
81
75
FALSE
yes
rainy
71
91
TRUE
no
[2] 모든 필드가 범주형으로 변환된 형태
Outlook
temperature
humidity
windy
play
sunny
hot
high
FALSE
no
sunny
hot
high
TRUE
no
overcast
hot
high
FALSE
yes
rainy
mild
high
FALSE
yes
rainy
cool
normal
FALSE
yes
rainy
cool
normal
TRUE
no
overcast
cool
normal
TRUE
yes
sunny
mild
high
FALSE
no
sunny
cool
normal
FALSE
yes
rainy
mild
normal
FALSE
yes
sunny
mild
normal
TRUE
yes
overcast
mild
high
TRUE
yes
overcast
hot
normal
FALSE
yes
rainy
mild
high
TRUE
no
데이터파일
(1) CSV - 콤마로 구분된 텍스트 파일 형식 (클레멘타인 등 데이터마이닝 프로그램에서 입력 가능함)
데이터에 매개효과가 존재하는지 어떻게 발견할 수 있을까? 출처의 글을 참고해보면 Sobel test 라는 분석 방법을 통해서 가능한 것 같다. 좀 더 자료를 찾아보고 공부해야하겠다.
Baron과 Kenny(1986)의 절차에 의하면, 매개효과가 있다는 것을 증명하기 위해서는 세 단계의 회귀분석을 실시해야 한다. 먼저 독립변인(예언변인)이 매개변인을 유의하게 예언해야 하고(절차 1), 독립변인이 종속변인(준거변인)을 유의하게 예언해야 한다(절차 2). 그리고 독립변인과 매개변인이 동시에 종속변인을 예언하도록 하는 회귀분석에서는 매개 변인이 종속 변인을 유의하게 예언하면서 단계 1의 독립변인의 효과가 유의하게 줄어들어야 한다(절차 3). 매개변인의 효과를 통제하고 남은 독립변인의 효과가 ‘0’에 가까울수록 매개효과는 큰 것이며, ‘0’이 되면 완전한 매개효과를 지닌다고 결론지을 수 있다(Kenny, 2001).
Sobel(1982)의 제안에 따르면 매개효과가 ‘0’보다 큰지에 대한 여부는 Z검증으로 가능하다.
여기에서 a와 sea는 독립변인으로 매개변인을 예언하는 회귀분석에서의 회귀계수 및 표준편차이고, b와 seb는 매개변인으로 종속변인을 예언하는 회귀분석에서의 회귀계수 및 표준오차를 의미한다.
먼저 위계적 회귀분석을 통해서 매개효과가 존재하는지를 확인한 뒤 Sobel test를 통해서 매개효과를 검증합니다.
매개효과 확인을 위한 위계적 회귀분석에 들어가기 앞서 기본 가정을 확인하는 절차를 분석하면서 단계적 회귀분석으로 유의미한 변인을 먼저 확인합니다. 그리고 유의미한 변인들 위계적 회귀분석에 투입하여 매개효과를 확인합니다. 위와 같은 방법을 사용한 논문을 본 기억이 나네요.
시청하기 원하는 확장자가 bgdb인 파일을 어떤 파일을 더블클릭하여 동영상 강좌를 시청해봅시다.
아~ 그런데 !! "강의 압축파일 인증에 실패했습니다." 라는 에러 메시지가 발생할 수도 있습니다.
이 문제를 해결하기 위해서는 아래의 프로그램을 사용하여 크랙을 해제하면 됩니다.
이 화면에서 [...] 버튼을 누른 후 강좌파일(*.bgdb)이 있는 폴더를 선택한 후 [변환 시작] 버튼을 누릅니다.
그러면, 해당 폴더에 새로운 폴더가 생성되며 시청할 수 있는 *.bgdb 파일이 새롭게 생성됩니다.
이제 새롭게 생성된 bgdb 파일을 더블클릭하면 해당 동영상 강좌를 시청할 수 있습니다.
위 홈페이지의 무료 레슨에서 [어설픈레슨] 의 내용입니다.
기타를 처음 배우는 쌩초보 분들이 재미있게 배울 수 있는 좋은 강좌입니다.
[1강] 좀어설픈레슨 _ 01 : 첫 시작과 왼손 코드잡는 자세
일단 이번에 지영양과 함께 배울곡은 '내가 찾는 아이' 입니다.
D 코드로 시작되는 박보상에 #이 두개붙는 코드입니다.
곡을 배우면서 코드 잡는 법, 스트로크 하는법, 코드 전환하는 법, 그외에 자잘한 세부 사항들을 함께 배우게 될겁니다. 여러분들도 따라하시면서 노하우를 익히시면 좋을거 같습니다.
[2강] 좀 어설픈 레슨 _ 02 : 통기타 튜닝해보기
기본적인 튜닝에 대해서 알아보는 동영상입니다. 절대적으로 맞춰야 하는 6줄을 순서대로 정확하게 튜닝하기 위해서 여섯줄의 음을 미리 알아둬야 합니다.
동영상을 보기 위해서는 아래의 더보기 를 클릭하세요.
바로 '미라레솔시미', 가장 두꺼운 줄(6번줄)부터 미라레솔시미 입니다. 6번줄의 미와 1번줄의 미는 두옥타브 차이입니다. 일단 기타 코드를 치려면 위의 음대로 줄을 튜닝해야 합니다. 그럼 아래 영상을 보시죠.
[4강] 도레미파 계이름 쳐보기
동영상을 보고 싶다면 아래의 더보기 를 클릭하세요.
여기서 중요한건 두번째 손가락이 1번프렛, 세번째 손가락이 2번프렛, 네번째 손가락이 3번 프렛 위에서 떠나면 안된다는 것입니다. 기본적으로 피킹이랑 같이 연습을 하셔야 하는데 그게 잘 안된다면 피킹으로 연습을 해보세요. 도레미파솔라시도 이렇게 올라갔다가 다시 도시라솔파미레도가 자연스럽게 될때까지 틈나면 연습해보세요. 나중에 핑거스타일 연습에 많은 도움이 되실겁니다.
[5강] 내가 찾는 아이 - 우리가 함께 배울 곡 - 코드포함
이건 진짜 쫌 아니긴 한데. ㅋㅋ 후반부에 나오는 프렛따라 쭉쭉 올라가는 코드들은 안할꺼니까 걱정안하셔도 되고 좀 더 쉽고 재밌게 배워보도록 하겠습니다.
동영상을 보고 싶다면 아래의 더보기 를 클릭하세요.
RECENT COMMENT