Study Room/Research Methodology 15

사회연결망분석 (Social Network Analysis)

우리는 자신도 모르는 사이에 수많은 사회연결망에 연결되어있다.혈연, 지연, 학연, 업력, 종교 등 서로 다른 수많은 연결망을 그려볼 수 있다. 이미 세상은 6단계만 건너면 누구나 연결될 수 있는 small world로 연결되어버렸고,인터넷이라는 거대한 연결망은 그 거리와 속도를 엄청나게 단축시키고 범위를 확장시켜버렸다. 나와 관련된 연결망을 그려보는 것은 매우 흥미로운 일이다.당장 SNS에 등록된 친구들만 가지고도 거대한 연결망을 그려볼 수 있을 것같다. 하지만, 막상 사회연결망을 그려보려고 하면 뭔가 막막하다.나와 다른 사람들과의 관계는 쉽게 그릴 수 있는데 다른 사람과 다른 사람의 관계는 어떻게 그리지? 여기서부터 막막해지기 시작하면서 고민되기 시작한다.사회연결망 분석이 굉장히 매력적으로 보이면서도 ..

[Research⑭] 요인분석(Factor Analysis)

요인분석은 변수들 간의 상호 연관성을 분석해서공통적으로 작용하고 있는 요인들을 추출하여전체자료를 대변할 수 있는 변수의 수를 줄이는 기법이다. 간단히 이야기하면중복되는 변수들을 줄여서 보는 사람이 쉽게 파악할 수 있게 만드는 것이다. 변수의 수를 줄이면, 연구 모형이 간단해 질 수 있고,정보와 지식을 보다 효과적으로 전달할 수 있기 때문이다. 요인분석을 위해서는 아래 조건들을 만족해야 한다.1) 사용되는 변수들이 모두 등간척도나 비율척도로 측정한 양적 변수여야 하며,2) 관찰치들은 서로 독립적이며 정규분포를 이루며, 변수별로 분산은 모두 동일하다는 가정을 만족시켜야한다. (응답자의 수는 최소한 변수 수의 3배 이상은 되어야 요인분석이 가능하다.)3) 입력되는 변수들 간에는 어느 정도 수준 이상의 상관관계..

[Research⑬] 회귀분석 (Regression Analysis)

회귀(regression)이라는 말은유전학자 프란시스 골턴이 유전의 법칙을 연구하다 나온 명칭이다. 프란시스 골턴은아버지의 키가 아무리 크다고 할지라도아들의 키는 아들 세대의 평균으로 접근하는 경향이 있다는 것을 발견했다.(다행이다... 내 아들은 키가 작지 않을 수도 있다.) 골턴은 이러한 현상을평균으로의 회귀(regression toward mean)이라 했다. 회귀의 법칙을 활용한다면전체 평균 값을 가지고 알지 못하는누군가의 키를 예측해볼 수 있는 것이다.(남자 평균이 170정도 되니, 소개팅 남의 키도 170 정도 되겠지? 뭐 이런 거) 하지만, 단순히 평균으로만 예측하면,예측의 정확도가 너무나 떨어지는 경향이 있다. 그래서, 몸무게같이키에 영향을 주는 다른 요인을 활용하면좀 더 정확하게 키를 예..

[Research⑫] 분산분석 (ANOVA)

집단 간의 평균 차이를 검정할 때는 t검정을 활용한다.하지만, 집단이 3개 이상이 되면 한 번에 분석하기 어려워진다. 이렇게 3개 이상의 집단 간 평균을 검정할 때사용하는 분석방법이 분산분석(Analysis of Variance) 이다. 흥미로운 점은평균 차이를 비교하는데, 분산의 개념을 활용한다는 점이다. 평균을 직접 비교하지 않고,분산을 통한 방식으로 평균 비교가 가능하다는 이야기인데, 그 이유는집단의 평균들이멀리 떨어져 분산이 크면 클수록집단간의 평균들이 서로 다르기 때문이다. 교재에 나온 사례와 표를 보면 좀 더 명확해진다.(source: 이훈영의 연구방법론 p.359) 그래프를 보면평균의 차이를 만드는 2가지 요인을 확인할 수 있다. 경영학과의 학년별 평균차이가경제학과나 행정학과보다 명확하게 나..

[Research⑪] 연관성 분석

연구를 진행할 때,한 가지 변수만 놓고 연구하는 경우는 별로 없다.(현실에서도 한 가지만 존재하는 경우는 거의 없다.) 그래서 여러 가지 변수들 간에어떠한 연관성을 가지고 있는지 확인하는 것은 중요하다.이렇게 변수들간의 관계를 파악하는 것이 바로 연관성 분석이다. 연관성을 분석하는 방법에는상관분석과 교차분석이 있는데, 변수가 명목척도/서열척도의 경우에는 교차분석을변수가 등간척도/비율척도의 경우에는 상관분석을 활용한다. (source: 이훈영의 연구방법론 p.327) + 상관분석(correlation analysis)은변수 간의 선형관계 정도를 분석하기 때문에,두 변수 간의 공분산(Covariance)분석으로 시작하게 된다. 공분산은 동시에 2개 변수 값들을 갖는 개별 관측치들이각 변수의 평균으로부터 어느..

[Research⑩] 타당성과 신뢰성

과학적 연구를 한다고 해도대부분의 경우 측정하는 과정에서 오차는 발생하게 된다.그럼으로 오차를 얼마나 줄일 수 있느냐는 항상 관심의 대상이다. 타당성(Validity)이란올바른 측정 도구와 측정 방법을 사용했느냐의 문제이며, 신뢰성이란측정대상을 정확하게 선정하여타당성있는 측정 도구와 방법을 신뢰할 수 있게 사용했냐의 문제이다. 이 두가지에서 검증을 받아야만,연구한 결과를 과학적 연구 결과라고 이야기할 수 있는 것이다. + 타당성(Validity)은 예를 들면,키를 측정하려면 신장계를 이용하고,몸무계를 측정하려면 체중계를 이용하는 것을 말한다. 타당성이 없다는 것은IQ를 측정하려고 머리둘레를 확인하거나,체력을 측정하려고 몸무계를 확인하는 것을 의미한다. 이런 바보가 어디있나 싶겠지만,실제 연구할 때는 이렇..

[Research⑨] 가설 설정 및 가설 검정

가설이란이미 1강에서 충분히 다루었듯이과학적 조사에 의하여 검정이 가능한 사실로써두 개 이상의 변수 또는 현상 간의 관계를 검정가능한 형태로 서술한 문장이다. 과학적 연구라는 것 자체가이러한 가설들을 검정하는 과정이다. 가설에는귀무 가설 (Null hypothesis; H0)와대립 가설 (Alternative Hypothesis: H1)이 있다. 귀무 가설이란 기존에 일반적인 사실로 받아들여지고 있는 내용이며,대립 가설이란 귀무 가설과 반대되는 새롭게 검정하고자 하는 주장이다. 흥미로운 것은 무슨 과학적 연구가챔피언 타이틀 매치 같은 형태로 진행된다는 것이다. 기존의 연구 내용이 있는데, 기존에 비해 차이가 있다나 효과가 있다고 증명해내야지,새로운 가설이 맞다는 것을 인정해준다는 것이다.(심지어는 동일하..

[Research⑧] 추정(estimation)과 표본 크기 산출

지난 번에도 이야기했지만,모든 조사대상자를 다 조사해보면 좋지만, 시간도, 돈도, 능력도 부족하기에표본(sample)조사를 할 수밖에 없다. 그렇다면, 가장 문제는 표본 조사의 결과를얼마나 신뢰할 수 있고 일반화할 수 있느냐의 문제에 빠지게 된다. 그렇기 때문에 확률이나 추정이라는 개념이 매우 중요하다. 내가 조사한 표본이 얼마나 정확하고, 그 결과를 가지고 어떻게 모집단에 대입할 수 있는지... + 추정(estiamtion)은표본 조사 결과를 가지고모집단의 특성을 알아보는 과정을 말한다. 추정은 크게 두 가지 종류로 나눠지는데,점추정은 하나의 수치로 모집단의 모수를 측정하는 것이고,구간추정은 하나의 수치가 아닌 특정 구간으로 모수를 측정하는 것이다. 점추정의 경우 선택된 추정량이모수와 정확하게 일치하는..

[Research⑦] 확률과 확률 변수

이번에는 좀 더 복잡한 이야기를 해야겠다. 고등학교 수학시간에확률부분을 열심히 공부했다면 매우 쉽게 느껴지겠지만대부분의 사람들이 졸업과 동시에 까먹기에 다소 불편할 수도 있다. 확률(probability)은경험 또는 실험의 결과로 특정한 사건이나 결과가 발생할 가능성을 말한다.(뭐 여기서부터 어렵다고 하는 사람은 없겠지만... 아직은 어려우면 안된다) 표본 공간(sample space)은실험이나 조사를 통해서 나올 수 있는 가능성을 모두 표기한 것을 이야기한다. 그렇다면 왜 확률을 공부해야하는가? 이유는 간단하다. 앞서 이야기한대로, 모든 내용을 다 조사하면 좋지만,돈도 없고, 시간도 없고, 역량도 부족하니 표본(sample)을 뽑아서 조사한다.그리고 그 조사가 얼마나 현실에 적용할 수 있는지 확인해야한..

[Research⑥] 척도의 종류와 리커트 척도

척도는 관찰대상의 속성을 측정하여그 값을 숫자로 나타내는 일종의 규칙을 말한다. 쉽게 생각하면,사람마다 이야기하는게 다르면 평가하기 어려우니규칙을 만들어서 숫자로 나타내서 누구나 공감하게 만들자는 것이다. 왜 평가하는지와 무엇을 평가하는지에 따라서각기 다른 규칙이 필요한 것은 당연한 이야기다. 그래서 척도도 정보량에 따라서 크게 4종류로 나타나게 된다. 명목척도 < 서열척도 < 등간척도 < 비율척도 명목 척도는 그냥 구분을 위해서 별 의미없이 숫자를 매긴 것이고,서열 척도는 그냥 순서를 정하기 위해서 순서를 매긴 것을 의미하며,등간 척도는 상대적 크기를 측정하기 위해서 간격을 구분한 것을 의미하며,비율 척도는 절대적 크기를 측정하기 위해서 비율의 개념이 들어간 것을 의미한다. 정보의 량이 많아질수록 당연..