작업형
(총점 40점, 주어진 데이터 및 통계 문제를 SPSS로 분석한 후 종이 답안지에 수치, 가설채택/기각 등 적어서 제출)
예시: 성별에 따른 시험 점수를 분석하시오 -> SPSS로 필요한 검정을 실시한 후, 두 집단 평균에 유의한 차이가 있는지 없는지 유의확률을 확인하여 귀무가설 서술 및 대립가설 기각/채택여부 답안지에 적기
* 두 유형 모두 통계 공식을 외워서 손으로 계산해야 하는 문제같은 건 안 나옴! (계산기는 필기에서만 필요)
TIP. 자료의 유형에 따른 분석 방법의 결정
독립변수 | |||
범주형 | 연속형 | ||
종속변수 | 범주형 | 카이제곱검정 | 로지스틱 회귀(시험에 안나옴) |
연속형 | T검정, 분산분석 | 상관분석, 회귀분석 |
* 값들이 1, 2, 3의 숫자로 되어 있는 변수라도, 그게 사실은 어떤 뜻을 나타내는 명목변수면 범주형에 속함
* 시험 점수, 월급처럼 숫자 스펙트럼이 끊김없이 쭉 이어지는 숫자들이라면 연속형에 속함
분석준비단계
- 구분자는 탭만 선택(공백 체크 해제)
- 레이블, 값, 측도 설정
- 결측값 처리
- 오류값 찾기 및 결측값 처리 : 분석 > 기술통계량 > 빈도분석으로 빈도분석 결과를 보면 응답 범주를 벗어난 값을 확인한 후 변수 보기 탭에서 결측값 처리
기술통계
- 분석표
- 분석 > 기술통계량 > 기술통계 > 옵션(평균,표준화편차,최소값,최대값 등)
교차분석 = 카이제곱 검정
- 차이가 있는지 파악하기 위한 교차표
- 변환 > 다른변수로 코딩변경 > 변수값 설명을 입력
- 분석 > 기술통계량 > 교차분석 > 셀(관측빈도,퍼센트 선택)
- 검정통계량 : 분석 > 기술통계량 > 교차분석 > 통계량(카이제곱 선택)
독립표본T검정
- 집단에 따라 변수에 차이가 있는지 검정
- 분석 > 평균 비교 > 독립표본 T 검정
- 검정통계량 t값이 ~이고 유의확률 p값이 ~로 유의수준 0.05보다 크므로 귀무가설을 채택한다.
일원배치 분산분석 =여러 집단 기술통계, 분산분석
- 분석 > 평균비교 > 일원배치 분산분석 > 옵션(기술통계,분산 동질성 검정)
- 귀무가설 : 모분산은 모두 동일하다. >0.05 대립가설 : 모분산이 모두 동일한 것은 아니다.<0.05
- Levene 검정 = 분산 동질성 검정
- 그룹 간, 그룹내 = 일원배치 분산분석
상관계수 = 상관계수 결과표
- 분석 > 상관분석 > 이변량 상관 (Pearson)
회귀분석 = 회귀모형
- 분석 > 회귀분석 > 선형
- 귀무가설 : 회귀모형은 유의하지 않다.
- 회귀식 : 상수+ 비표준화계수 * 변수 . . .
- 수정결정계수 = 모형 요약에서 수정된 R 제곱
- 집단 분할 : 데이터 > 파일분할 > 집단들 비교
- 제공된 시험지의 코딩 양식 확인(코드북 확인)
- 문항, 변수명, 내용, 결측치 처리 등을 확인
- 원시 데이터 확인(txt)
- 변인 간의 구분자 확인 불러들이는 방법 확정
- tab, 빈공간, 특수기호 등등
- 불러들인 후 자료 확인
- txt => sav 변환 시 코드북에 맞게 입력되었는지 확인
- 불필요하게 입력된 ‘점(.)’ 등의 행렬 삭제
- 변수명 입력
- 문항, 변수, 내용, 결측치 처리 입력
- 결측치 처리란?
무응답을 컬럼 내의 지정된 수치로 입력
응답거부(98), 무응답(99) 둥으로 지정
- 결측치 처리 이유
실제 조사에서 100% 응답을 받아내기란 어려우므로, 무응답 한 부분의 경우 분석에서 자동 제거하여 분석함
100% 응답이 아닐 경우 자료 자체를 제거하기도 함
- 이상치와 오류값
이상치: 응답은 정확하나, 동떨어진 값 (예>한국 성인남자 키와 몸무게를 측정하는데, 최홍만 선수의 키와 몸무게가 있을 경우)
오류값: 응답범주 외의 수치가 입력된 경우 (예> 응답이 2번까지만 있는데 2이상의 3,4등이 입력된 경우)
- 무응답, 응답 거부의 처리
- 무응답, 응답거부를 결측치 처리(missing value)할 것인가? (예>결측값 “9”, “99”)
- 응답 자체에서 제거 할 것인가? 선택
- 역코딩 확인
- 긍정이 최고점이 되도록 변환( 예>6-x1)반드시 결측, 이상치 처리 후
- 소수점 확인
- 반올림, 올림, 몇쨰 자리 등
- 평균값 처리 방법
- 모두 응답한 경우에만 평균 산출 (산식: (x1+x2)/2 이용)
- 응답 여부에 상관없이 평균 산출 (산식: mean(x1,x2) 이용)
- 유의 수준 확인
- 유의수준이 0.05, 0.1 0.01 확인
- 문제에서 주어지지 않는다면, 0.05 범위로 해석
- 반드시 앞에서부터 풀이
- 결측값 처리, 변수 삭제 등이 주어지므로 반드시 앞에서부터 문제 풀이
- 변수 계산의 동요 함수
- mean 함수 [mean(X1, X2, X3)] 와 산식(X1+X2+X3)/3 차이점
- sum 함수 [SUM(X1, X2, X3)] 와 산식(X1+X2+X3) 차이점
- ABS: 절대값
- LN: 로그
- SQRT: 루트
- Trunc: 절사하기
예> trunc (4.579, 0.1) = 4.5, 소수점 첫째자리 이후 무조건 절사
traunc(4.579, 1) = 4, 소수점 자리는 무조건 절사
- RND: 반올림하기
예> RND(4.579, 0.1) = 4.6, 소수점 둘째 자리에서 반올림하여 소수점 첫째자리로 만듦
'things > IT' 카테고리의 다른 글
2. 평균 비교_평균 분석, T검정(일표본,독립, 대응), 분산 분석(일원배치, 이원배치, 다원배치-> 사후분석) (0) | 2021.10.21 |
---|---|
1. 기술통계량_빈도 분석, 기술 통계, 일원배치 분산 분석, 교차 분석 (0) | 2021.10.21 |
SPSS 변수 보기 (0) | 2021.10.20 |
SPSS 작업형 실습공부_(1)~(5) (0) | 2021.10.13 |
SPSS 텍스트 가져오기 마법사 6단계 (0) | 2021.10.12 |