728x90

통계적 자료 처리

통계학은 자료를 수집하고, 정리하고, 분석할 뿐만 아니라 그 분석을 토대로 합리적인 의사결정을 할 수 있도록 하는 과학적인 방법입니다.

이를 효과적으로 수행하려면 우선 조사대상이 되는 문제가 무엇인가에 대한 정확한 문제정의와 확인이 필요합니다.

문제정의가 결정되면 문제에 대한 가설을 설정하게 되고 이 가설을 검정할 자료를 수집하게 됩니다.

이렇게 자료가 수집되면 그 자료 분석에 적합한 통계기법을 적용하여 분석하게 됩니다.

이러한 단계 중 가장 중요한 단계는 역시 문제의 정확한 정의와 확인 단계입니다.

보통 초보자는 이 부분을 소홀히 하여 대충 건너뛰게 되고 분석기법에만 관심을 가집니다.

이는 통계학 지식, 즉 분석기술을 모르기 때문인데, 첫 단계에서 문제정의를 잘하고 두 번째 단계에서 가설 설정을 하더라도 통계학 기법을 모르면 아무 쓸모가 없다는 걱정이 앞서기 때문입니다.

이 책에서는 이들 중 네 번째 단계에 대해 집중적으로 다루어 연구자들이 통계학에 대한 실질적 개념을 갖고 첫 두 단계에 노력을 할애하여 연구가 보다 완벽해지도록 하였습니다.

 

< 자료분석의 순서 >

1. 문제정의와 확인 

2. 가설 설정

3. 자료 수집

4. 통계기법 적용

5. 결론 도출 󰠨

 

통계적 자료처리를 실행하기 위해서는 통계학 이론, SAS, SPSS 또는 R 같은 통계패키지에 관한 지식, 그리고 컴퓨터에 대한 지식을 필요로 합니다.

이 세 분야는 그 범위가 상당히 광범위하지만 가능한 한 쉽게 설명하였으므로 이해하기 편리할 것입니다.

특히 세 가지 중 한 분야만 알고 있으면서 다른 분야를 알려는 독자는 상당히 이해하기 쉬울 것으로 생각됩니다.

 

설문지 예제와 측정척도

 

수집된 자료를 분석하는 데에는 여러 가지 통계기법이 적용되는데 이 통계기법은 수집된 자료의 문항의 성격에 따라 다릅니다.

우선 실제 자료를 구하는 간단한 예를 들었습니다.

어떤 회사 내의 일반 사무직 근로자에 대해 다음과 같은 설문지를 작성하여 조사하였습니다.

 

설문지 예제

I. 다음은 귀하께서 직장생활을 하면서 평소 느끼고 계시는 사항에 관한 것입니다.

귀하의 생각과 일치하는 번호에 0표하여 주십시오.

 

1. 귀하는 지금의 회사에서 근무하는 데 보람과 긍지를 느끼고 있습니까?

매우 그렇지 않다 그렇지 않다 그저 그렇다 그렇다 매우 그렇다

 

2. 귀하의 임금 보수체계에 만족하십니까?

매우 그렇지 않다 그렇지 않다 그저 그렇다 그렇다 매우 그렇다

 

3. 귀하의 월 평균 급여액은 얼마나 됩니까? (        )  만원

 

II. 다음은 여가활동에 관한 사항입니다.

 

1. 귀하는 여가를 어떻게 보내고 있습니까??

 독서  스포츠  영화감상  낚시

 등산  음악 감상 여행  기타 (_____)

 

 

I. 다음은 응답자 본인의 개인적 사항에 대하여 묻습니다. 해당란에 0 표하여

주십시오.

 

1. 귀하의 성별은?  남자 ( )  여자 ( )

2. 결혼여부는 결혼 여부는? 미혼 ( )  기혼 ( )

3. 귀하의 연령은? ( )

4. 귀하의 학력은??

 고졸이하고졸 이하( )  전문대졸이하전문대졸 이하( )  대졸이하대졸 이하( )  대학원졸 이상( )

 

5. 귀하의 근무경력은??

 11년 이하 1년이상-31년 이상-3년 미만 3년이상-53년 이상-5년 미만 5년이상

 

6. 입사한 날짜는 언제입니까? ----    

자료수집을 위한 설문지의 예

 

측정척도는 실제로 조사하고자 하는 문항의 성격에 따라 다를 수 있습니다.

이는 분석하고자 하는 문제의 성격, 조사비용 그리고 설문 응답자의 편의성 등 여러 가지 사항을 고려하여 측정척도를 바꿀 수 있습니다.

이때에도 조사목적, 조사하고자 하는 대상, 샘플링 방법 그리고 적용되는 통계기법에 상당히 유의해야 합니다.

 

측정척도

 

● 명목척도(nominal scale)

명목척도는 단순히 어떤 대상의 내용이나 특성을 분류하거나 구분하기 위해 사용되는 척도입니다.

예를 들면 성별, 결혼여부, 여가활동에 해당하는 것으로 남자를 나타내는 숫자 1’ 여자를 나타내는 숫자 2’는 그 크기에 있어 아무 관계가 없습니다.

 

● 서열척도(ordinal scale, ranking scale)

이를 순위척도라고도 하는데 이름 그대로 순위가 있는 척도를 말합니다.

숫자의 크기로 그 상대적인 의미는 알 수 있는 척도입니다. 예를 들면 학력이나 회사에 대한 만족도, 임금 보수체계에 대한 만족도가 여기에 해당됩니다.

이 척도에 있어 󰡒아주 좋다󰡓라고 생각하는 정도가 󰡒아주 나쁘다󰡓라고 생각하는 경우보다 5배 정도로 좋다는 의미가 아닙니다.

 

● 구간척도(interval scale)

구간척도는 순위뿐만 아니라 측정치 간의 차이에 대해서도 그 의미가 있는 척도입니다.

예로서는 IQ점수, 온도를 들 수 있습니다. 기온 5도가 기온 1도보다 4도가 높다는 것은 의미가 있으나 5배가 높다는 의미는 아닙니다.

 

● 비율척도(ratio scale)

비율척도는 구간척도가 가지는 특성 에 절대 원점이라는 개념을 갖고 있으며 일반적으로 적용되는 통계기법은 구간척도와 같습니다.

예를 들면 길이, 면적 등과 같은 것으로 연령, 월평균 급여액과 같은 척도로서 연령의 경우 30세가 15세의 2배입니다..

 

측정척도에 따른 통계분석기법

 

녀별 여가활용방법에 대한 분석기법은 카이제곱법 PROC FREQ

녀 성별에 따라 여가활동을 보내는 방법을 분석하고자 할 때

남녀는 1, 2로 표시된 명목척도이고 여가 활동 또한 1, 2, 3, 4로 명목척도로 되어있기 때문에

카이제곱법을 이용합니다.

 

남녀별 급여 차이에 대한 분석기법은 t 검정 PROC TTEST

남녀 성별에 따라 급여 수준에 대한 분석을 하고자 할 경우,

남녀는 1, 2로 표시된 명목척도이고, 분석하고자 하는 급여액은 구간척도이므로

t-검정을 이용합니다.

 

학력별 급여 차이에 대한 분석기법은 분산분석법(ANOVA) - PROC ANOVA

학력 수준에 따른 급여 수준에 대한 분석을 하고자 할 경우,

학력 수준이 세 분류 상으로 조사되어 있으므로, 두 수준에 따른 차이 검정을 행하는 t-검정이 아닌, 분산분석법을 이용합니다.

물론 두 수준의 경우에 분산분석법을 적용해도 t-검정의 경우와 같은 결과를 얻을 수 있습니다.

 

남녀별 직무만족도에 대한 분석기법은 카이제곱법, 분산분석법 또는 t 검정

남녀 성별에 따라 회사에 대한 보람, 긍지에 대한 관계를 분석하고자 할 경우,

남녀는 명목척도이고 보람과 긍지에 관한 문항은 서열척도로 되어 있으므로 카이제곱법을 이용합니다.

보람과 긍지에 관한 척도가 5분 서열척도이므로 경우에 따라 분산분석법을 적용할 수도 있습니다.

이는 뒤에서 상세히 설명될 것입니다. 그러나 이 경우에는 카이제곱법을 추천합니다.

 

이렇게 분석하고자 하는 문항에 따라 그 적용기법이 다른 것을 볼 수 있습니다.

이는 각 문항의 척도가 다르기 때문입니다.

이와 같이 측정척도에 따라 그 기법이 달라지므로 그 척도를 주의하여 결정하여야 합니다.

그리고 척도에 따라 동일한 현상에 대한 결과가 다르게 나오는 경우가 있으므로 연구자는 통계기법보다 조사 설문지의 구성에 더욱 신경을 써야 할 것입니다.

+ Recent posts