본문 바로가기
things/IT

SPSS 작업형 이론

by ooook 2021. 10. 20.
728x90

 

 

작업형

 

(총점 40점, 주어진 데이터 및 통계 문제를 SPSS로 분석한 후 종이 답안지에 수치, 가설채택/기각 등 적어서 제출)

 

예시: 성별에 따른 시험 점수를 분석하시오 -> SPSS로 필요한 검정을 실시한 후, 두 집단 평균에 유의한 차이가 있는지 없는지 유의확률을 확인하여 귀무가설 서술 및 대립가설 기각/채택여부 답안지에 적기

 

* 두 유형 모두 통계 공식을 외워서 손으로 계산해야 하는 문제같은 건 안 나옴! (계산기는 필기에서만 필요)

 

 

 

TIP. 자료의 유형에 따른 분석 방법의 결정

  독립변수
범주형 연속형
종속변수 범주형 카이제곱검정 로지스틱 회귀(시험에 안나옴)
연속형 T검정, 분산분석 상관분석, 회귀분석

* 값들이 1, 2, 3의 숫자로 되어 있는 변수라도, 그게 사실은 어떤 뜻을 나타내는 명목변수면 범주형에 속함

* 시험 점수, 월급처럼 숫자 스펙트럼이 끊김없이 쭉 이어지는 숫자들이라면 연속형에 속함

 

 

분석준비단계

-       구분자는 탭만 선택(공백 체크 해제)

-       레이블, 값, 측도 설정

-       결측값 처리

-       오류값 찾기 및 결측값 처리 : 분석 > 기술통계량 > 빈도분석으로 빈도분석 결과를 보면 응답 범주를 벗어난 값을 확인한 후 변수 보기 탭에서 결측값 처리

 

기술통계

-       분석표

-       분석 > 기술통계량 > 기술통계 > 옵션(평균,표준화편차,최소값,최대값 등)

 

 

교차분석 = 카이제곱 검정

-       차이가 있는지 파악하기 위한 교차표

-       변환 > 다른변수로 코딩변경 > 변수값 설명을 입력

-       분석 > 기술통계량 > 교차분석 > 셀(관측빈도,퍼센트 선택)

-       검정통계량 : 분석 > 기술통계량 > 교차분석 > 통계량(카이제곱 선택)

 

 

독립표본T검정

-       집단에 따라 변수에 차이가 있는지 검정

-       분석 > 평균 비교 > 독립표본 T 검정

-       검정통계량 t값이 ~이고 유의확률 p값이 ~로 유의수준 0.05보다 크므로 귀무가설을 채택한다.

 

 

 

 

일원배치 분산분석 =여러 집단 기술통계, 분산분석

 

-       분석 > 평균비교 > 일원배치 분산분석 > 옵션(기술통계,분산 동질성 검정)

-       귀무가설 : 모분산은 모두 동일하다. >0.05 대립가설 : 모분산이 모두 동일한 것은 아니다.<0.05

-       Levene 검정 = 분산 동질성 검정

-       그룹 간, 그룹내 = 일원배치 분산분석

 

 

상관계수 = 상관계수 결과표

-       분석 > 상관분석 > 이변량 상관 (Pearson)

 

회귀분석 = 회귀모형

-       분석 > 회귀분석 > 선형

-       귀무가설 : 회귀모형은 유의하지 않다.

-       회귀식 : 상수+ 비표준화계수 * 변수 . . .

-       수정결정계수 = 모형 요약에서 수정된 R 제곱

-       집단 분할 : 데이터 > 파일분할 > 집단들 비교

 

 

 

  • 제공된 시험지의 코딩 양식 확인(코드북 확인)

-      문항, 변수명, 내용, 결측치 처리 등을 확인

 

  • 원시 데이터 확인(txt)

-      변인 간의 구분자 확인 불러들이는 방법 확정

-      tab, 빈공간, 특수기호 등등

 

  • 불러들인 후 자료 확인

-      txt => sav 변환 시 코드북에 맞게 입력되었는지 확인

-      불필요하게 입력된 (.)’ 등의 행렬 삭제

 

  • 변수명 입력

-      문항, 변수, 내용, 결측치 처리 입력

 

-      결측치 처리란?

무응답을 컬럼 내의 지정된 수치로 입력

응답거부(98), 무응답(99) 둥으로 지정

 

-      결측치 처리 이유

실제 조사에서 100% 응답을 받아내기란 어려우므로, 무응답 한 부분의 경우 분석에서 자동 제거하여 분석함

100% 응답이 아닐 경우 자료 자체를 제거하기도 함

 

-      이상치와 오류값

이상치: 응답은 정확하나, 동떨어진 값 (>한국 성인남자 키와 몸무게를 측정하는데, 최홍만 선수의 키와 몸무게가 있을 경우)

오류값: 응답범주 외의 수치가 입력된 경우 (> 응답이 2번까지만 있는데 2이상의 3,4등이 입력된 경우)

 

  • 무응답, 응답 거부의 처리

-      무응답, 응답거부를 결측치 처리(missing value)할 것인가? (>결측값 “9”, “99”)

-      응답 자체에서 제거 할 것인가? 선택

 

  • 역코딩 확인

-      긍정이 최고점이 되도록 변환( >6-x1)반드시 결측, 이상치 처리 후

 

  • 소수점 확인

-      반올림, 올림, 몇쨰 자리 등

 

  • 평균값 처리 방법

-      모두 응답한 경우에만 평균 산출 (산식: (x1+x2)/2 이용)

-      응답 여부에 상관없이 평균 산출 (산식: mean(x1,x2) 이용)

 

  • 유의 수준 확인

-      유의수준이 0.05, 0.1 0.01 확인

-      문제에서 주어지지 않는다면, 0.05 범위로 해석

 

  • 반드시 앞에서부터 풀이

-      결측값 처리, 변수 삭제 등이 주어지므로 반드시 앞에서부터 문제 풀이

 

  • 변수 계산의 동요 함수

-      mean 함수 [mean(X1, X2, X3)] 와 산식(X1+X2+X3)/3 차이점

-      sum 함수 [SUM(X1, X2, X3)] 와 산식(X1+X2+X3) 차이점

-      ABS: 절대값

-      LN: 로그

-      SQRT: 루트

-      Trunc: 절사하기

> trunc (4.579, 0.1) = 4.5, 소수점 첫째자리 이후 무조건 절사

      traunc(4.579, 1) = 4, 소수점 자리는 무조건 절사

-      RND: 반올림하기

> RND(4.579, 0.1) = 4.6, 소수점 둘째 자리에서 반올림하여 소수점 첫째자리로 만듦

728x90