research methodology 14

[Research⑭] 요인분석(Factor Analysis)

요인분석은 변수들 간의 상호 연관성을 분석해서공통적으로 작용하고 있는 요인들을 추출하여전체자료를 대변할 수 있는 변수의 수를 줄이는 기법이다. 간단히 이야기하면중복되는 변수들을 줄여서 보는 사람이 쉽게 파악할 수 있게 만드는 것이다. 변수의 수를 줄이면, 연구 모형이 간단해 질 수 있고,정보와 지식을 보다 효과적으로 전달할 수 있기 때문이다. 요인분석을 위해서는 아래 조건들을 만족해야 한다.1) 사용되는 변수들이 모두 등간척도나 비율척도로 측정한 양적 변수여야 하며,2) 관찰치들은 서로 독립적이며 정규분포를 이루며, 변수별로 분산은 모두 동일하다는 가정을 만족시켜야한다. (응답자의 수는 최소한 변수 수의 3배 이상은 되어야 요인분석이 가능하다.)3) 입력되는 변수들 간에는 어느 정도 수준 이상의 상관관계..

[Research⑬] 회귀분석 (Regression Analysis)

회귀(regression)이라는 말은유전학자 프란시스 골턴이 유전의 법칙을 연구하다 나온 명칭이다. 프란시스 골턴은아버지의 키가 아무리 크다고 할지라도아들의 키는 아들 세대의 평균으로 접근하는 경향이 있다는 것을 발견했다.(다행이다... 내 아들은 키가 작지 않을 수도 있다.) 골턴은 이러한 현상을평균으로의 회귀(regression toward mean)이라 했다. 회귀의 법칙을 활용한다면전체 평균 값을 가지고 알지 못하는누군가의 키를 예측해볼 수 있는 것이다.(남자 평균이 170정도 되니, 소개팅 남의 키도 170 정도 되겠지? 뭐 이런 거) 하지만, 단순히 평균으로만 예측하면,예측의 정확도가 너무나 떨어지는 경향이 있다. 그래서, 몸무게같이키에 영향을 주는 다른 요인을 활용하면좀 더 정확하게 키를 예..

[Research⑫] 분산분석 (ANOVA)

집단 간의 평균 차이를 검정할 때는 t검정을 활용한다.하지만, 집단이 3개 이상이 되면 한 번에 분석하기 어려워진다. 이렇게 3개 이상의 집단 간 평균을 검정할 때사용하는 분석방법이 분산분석(Analysis of Variance) 이다. 흥미로운 점은평균 차이를 비교하는데, 분산의 개념을 활용한다는 점이다. 평균을 직접 비교하지 않고,분산을 통한 방식으로 평균 비교가 가능하다는 이야기인데, 그 이유는집단의 평균들이멀리 떨어져 분산이 크면 클수록집단간의 평균들이 서로 다르기 때문이다. 교재에 나온 사례와 표를 보면 좀 더 명확해진다.(source: 이훈영의 연구방법론 p.359) 그래프를 보면평균의 차이를 만드는 2가지 요인을 확인할 수 있다. 경영학과의 학년별 평균차이가경제학과나 행정학과보다 명확하게 나..

[Research⑪] 연관성 분석

연구를 진행할 때,한 가지 변수만 놓고 연구하는 경우는 별로 없다.(현실에서도 한 가지만 존재하는 경우는 거의 없다.) 그래서 여러 가지 변수들 간에어떠한 연관성을 가지고 있는지 확인하는 것은 중요하다.이렇게 변수들간의 관계를 파악하는 것이 바로 연관성 분석이다. 연관성을 분석하는 방법에는상관분석과 교차분석이 있는데, 변수가 명목척도/서열척도의 경우에는 교차분석을변수가 등간척도/비율척도의 경우에는 상관분석을 활용한다. (source: 이훈영의 연구방법론 p.327) + 상관분석(correlation analysis)은변수 간의 선형관계 정도를 분석하기 때문에,두 변수 간의 공분산(Covariance)분석으로 시작하게 된다. 공분산은 동시에 2개 변수 값들을 갖는 개별 관측치들이각 변수의 평균으로부터 어느..

[Research⑩] 타당성과 신뢰성

과학적 연구를 한다고 해도대부분의 경우 측정하는 과정에서 오차는 발생하게 된다.그럼으로 오차를 얼마나 줄일 수 있느냐는 항상 관심의 대상이다. 타당성(Validity)이란올바른 측정 도구와 측정 방법을 사용했느냐의 문제이며, 신뢰성이란측정대상을 정확하게 선정하여타당성있는 측정 도구와 방법을 신뢰할 수 있게 사용했냐의 문제이다. 이 두가지에서 검증을 받아야만,연구한 결과를 과학적 연구 결과라고 이야기할 수 있는 것이다. + 타당성(Validity)은 예를 들면,키를 측정하려면 신장계를 이용하고,몸무계를 측정하려면 체중계를 이용하는 것을 말한다. 타당성이 없다는 것은IQ를 측정하려고 머리둘레를 확인하거나,체력을 측정하려고 몸무계를 확인하는 것을 의미한다. 이런 바보가 어디있나 싶겠지만,실제 연구할 때는 이렇..

[Research⑨] 가설 설정 및 가설 검정

가설이란이미 1강에서 충분히 다루었듯이과학적 조사에 의하여 검정이 가능한 사실로써두 개 이상의 변수 또는 현상 간의 관계를 검정가능한 형태로 서술한 문장이다. 과학적 연구라는 것 자체가이러한 가설들을 검정하는 과정이다. 가설에는귀무 가설 (Null hypothesis; H0)와대립 가설 (Alternative Hypothesis: H1)이 있다. 귀무 가설이란 기존에 일반적인 사실로 받아들여지고 있는 내용이며,대립 가설이란 귀무 가설과 반대되는 새롭게 검정하고자 하는 주장이다. 흥미로운 것은 무슨 과학적 연구가챔피언 타이틀 매치 같은 형태로 진행된다는 것이다. 기존의 연구 내용이 있는데, 기존에 비해 차이가 있다나 효과가 있다고 증명해내야지,새로운 가설이 맞다는 것을 인정해준다는 것이다.(심지어는 동일하..

[Research⑧] 추정(estimation)과 표본 크기 산출

지난 번에도 이야기했지만,모든 조사대상자를 다 조사해보면 좋지만, 시간도, 돈도, 능력도 부족하기에표본(sample)조사를 할 수밖에 없다. 그렇다면, 가장 문제는 표본 조사의 결과를얼마나 신뢰할 수 있고 일반화할 수 있느냐의 문제에 빠지게 된다. 그렇기 때문에 확률이나 추정이라는 개념이 매우 중요하다. 내가 조사한 표본이 얼마나 정확하고, 그 결과를 가지고 어떻게 모집단에 대입할 수 있는지... + 추정(estiamtion)은표본 조사 결과를 가지고모집단의 특성을 알아보는 과정을 말한다. 추정은 크게 두 가지 종류로 나눠지는데,점추정은 하나의 수치로 모집단의 모수를 측정하는 것이고,구간추정은 하나의 수치가 아닌 특정 구간으로 모수를 측정하는 것이다. 점추정의 경우 선택된 추정량이모수와 정확하게 일치하는..

[Research⑦] 확률과 확률 변수

이번에는 좀 더 복잡한 이야기를 해야겠다. 고등학교 수학시간에확률부분을 열심히 공부했다면 매우 쉽게 느껴지겠지만대부분의 사람들이 졸업과 동시에 까먹기에 다소 불편할 수도 있다. 확률(probability)은경험 또는 실험의 결과로 특정한 사건이나 결과가 발생할 가능성을 말한다.(뭐 여기서부터 어렵다고 하는 사람은 없겠지만... 아직은 어려우면 안된다) 표본 공간(sample space)은실험이나 조사를 통해서 나올 수 있는 가능성을 모두 표기한 것을 이야기한다. 그렇다면 왜 확률을 공부해야하는가? 이유는 간단하다. 앞서 이야기한대로, 모든 내용을 다 조사하면 좋지만,돈도 없고, 시간도 없고, 역량도 부족하니 표본(sample)을 뽑아서 조사한다.그리고 그 조사가 얼마나 현실에 적용할 수 있는지 확인해야한..

[Research⑥] 척도의 종류와 리커트 척도

척도는 관찰대상의 속성을 측정하여그 값을 숫자로 나타내는 일종의 규칙을 말한다. 쉽게 생각하면,사람마다 이야기하는게 다르면 평가하기 어려우니규칙을 만들어서 숫자로 나타내서 누구나 공감하게 만들자는 것이다. 왜 평가하는지와 무엇을 평가하는지에 따라서각기 다른 규칙이 필요한 것은 당연한 이야기다. 그래서 척도도 정보량에 따라서 크게 4종류로 나타나게 된다. 명목척도 < 서열척도 < 등간척도 < 비율척도 명목 척도는 그냥 구분을 위해서 별 의미없이 숫자를 매긴 것이고,서열 척도는 그냥 순서를 정하기 위해서 순서를 매긴 것을 의미하며,등간 척도는 상대적 크기를 측정하기 위해서 간격을 구분한 것을 의미하며,비율 척도는 절대적 크기를 측정하기 위해서 비율의 개념이 들어간 것을 의미한다. 정보의 량이 많아질수록 당연..

[Research⑤] 표본선정과 표본추출

표본 선정에 있어서는당연히 전수조사를 하는 것이 젤 좋지만,돈도 없고, 시간도 없고, 통제도 안된다. 그래서 어쩔 수 없이항상 표본(Sample)을 추출해서 조사를 한 후 이를 일반화시킨다. 표본 추출 방법으로는 확률표본추출방법을 선호하지만,이 역시도 사전에 조사 대상자들의 자료가 있어야 하기에현실에서는 어쩔 수 없이 비활률표본추출방법을 많이 사용한다. (source: 이훈영의 연구조사방법론 p.155) 사회과학 연구에서 표본 선정의 이슈는신뢰도에 영향을 주는 매우 중요한 요소이지만,돈도, 시간도, 역량도 부족하여 항상 아쉬운 조사를 해야된다. 그래서 항상 열심히 연구를 해놓고도,보고서의 맨 끝에는 연구의 한계를 명확히 해야되고,항상 나름 연구자는 내 이런 한계를 잘 극복해주길 바란다며 이야기를 해야된다..