자료의 유형에 따른 분석 방법의 결정
독립변수 | |||
범주형 | 연속형 | ||
종속변수 | 범주형 | 교차분석 | 로지스틱 회귀(시험에 안나옴) |
연속형 | T검정, 분산분석 | 상관분석, 회귀분석 |
독립변수: 연속형
종속변수: 연속형
상관분석
(1) 피어슨 상관계수
두 범주형 변수 간의 연관성 검증 => 교차분석(카이제곱 검정)
두 연속형 변수 간의 선형 연관성을 나타내는 측도 => 상관계수
상관계수 = 상관계수 결과표
- 분석 > 상관분석 > 이변량 상관 (Pearson)
1) 가설설정하기
귀무가설: 선형 연관성은 없다
대립가설: 선형 연관성은 있다
2) 분석-상관분석-이변량 상관
3) 변수= 전기료, 가스비 설정하고 (Pearson)랑 양측 선택
4) 도출 결과
유의수준 0.05 > 유의확률 0.000 => 귀무가설 기각
즉, 유의수준 5%하에서 전기료와 가스비 간의 선형 연관성은 있다
회귀분석
회귀분석 = 회귀모형
- 분석 > 회귀분석 > 선형
- 귀무가설 : 회귀모형은 유의하지 않다.
- 회귀식 : 상수+ 비표준화계수 * 변수 . . .
- 수정결정계수 = 모형 요약에서 수정된 R 제곱
- 집단 분할 : 데이터 > 파일분할 > 집단들 비교
독립변수와 종속변수 간에 존재하는 연관성을 분석하기 위하여
관측된 자료에서 이들간의 함수적 관계식을 통계적으로 추정하는 방법
다른 변수에 영향을 주는 변수= 독립변수(설명변수)
독립변수에 의해 영향을 받는 변수= 종속변수(반응변수)
회귀분석은 독립변수의 수에 따라
독립변수가 1개= 단순회귀분석
독립변수가 2개 - 다중회귀분석
일반적으로 모두 선형회귀분석 이용
1) 분석- 회귀분석-선형
2) 소득에 따른 소비지출
종속변수=지출, 독립변수=소득
3) 회귀모형의 적합성
결정계수 값이 0.972로 총변동 중에서 회귀선에 의해 설명되는 비율은 97.2%
4) 회귀모형의 유의성 검정
유의수준 0.05 > 유의확률 0.00 => 귀무가설 기각
즉, 유의수준 5%하에서 회귀모형은 유의하다
5) 회귀계수의 유의성 검정
유의수준 0.05 > 유의확률 0.000 => 귀무가설 기각
즉, 유의수준 5%하에서 회귀계수 b는 유의하다
6) 회귀식 y=-8.736+ 1.116x
7) 비표준화, 비표준화 선택
'things > IT' 카테고리의 다른 글
ㅋㅎㅍㄱ 3 (0) | 2021.11.02 |
---|---|
4. 데이터 연산 및 문자 변수 추출 (0) | 2021.10.21 |
2. 평균 비교_평균 분석, T검정(일표본,독립, 대응), 분산 분석(일원배치, 이원배치, 다원배치-> 사후분석) (0) | 2021.10.21 |
1. 기술통계량_빈도 분석, 기술 통계, 일원배치 분산 분석, 교차 분석 (0) | 2021.10.21 |
SPSS 작업형 이론 (0) | 2021.10.20 |