본문 바로가기
things/IT

3. 상관분석, 회귀분석

by ooook 2021. 10. 21.
728x90

자료의 유형에 따른 분석 방법의 결정

  독립변수
범주형 연속형
종속변수 범주형 교차분석 로지스틱 회귀(시험에 안나옴)
연속형 T검정, 분산분석 상관분석, 회귀분석

 

독립변수: 연속형

종속변수: 연속형

 

 

상관분석

(1) 피어슨 상관계수

두 범주형 변수 간의 연관성 검증 => 교차분석(카이제곱 검정)

두 연속형 변수 간의 선형 연관성을 나타내는 측도 => 상관계수

 

상관계수 = 상관계수 결과표

-       분석 > 상관분석 > 이변량 상관 (Pearson)

 

 

1) 가설설정하기

귀무가설: 선형 연관성은 없다

대립가설: 선형 연관성은 있다

2) 분석-상관분석-이변량 상관

3) 변수= 전기료, 가스비 설정하고 (Pearson)랑 양측 선택

4) 도출 결과

유의수준 0.05 > 유의확률 0.000 =>  귀무가설 기각

즉, 유의수준 5%하에서 전기료와 가스비 간의 선형 연관성은 있다

 

 

회귀분석

 

회귀분석 = 회귀모형

-       분석 > 회귀분석 > 선형

-       귀무가설 : 회귀모형은 유의하지 않다.

-       회귀식 : 상수+ 비표준화계수 * 변수 . . .

-       수정결정계수 = 모형 요약에서 수정된 R 제곱

-       집단 분할 : 데이터 > 파일분할 > 집단들 비교

 

독립변수와 종속변수 간에 존재하는 연관성을 분석하기 위하여

관측된 자료에서 이들간의 함수적 관계식을 통계적으로 추정하는 방법

 

다른 변수에 영향을 주는 변수= 독립변수(설명변수)

독립변수에 의해 영향을 받는 변수= 종속변수(반응변수)

 

회귀분석은 독립변수의 수에 따라 

독립변수가 1개= 단순회귀분석

독립변수가 2개 - 다중회귀분석

 

일반적으로 모두 선형회귀분석 이용

1) 분석- 회귀분석-선형

2) 소득에 따른 소비지출

종속변수=지출, 독립변수=소득

 

3) 회귀모형의 적합성

결정계수 값이 0.972로 총변동 중에서 회귀선에 의해 설명되는 비율은 97.2%

 

4) 회귀모형 유의성 검정

유의수준 0.05 > 유의확률 0.00 => 귀무가설 기각

즉, 유의수준 5%하에서 회귀모형은 유의하다

 

5) 회귀계수 유의성 검정

유의수준 0.05 > 유의확률 0.000 => 귀무가설 기각

즉, 유의수준 5%하에서 회귀계수 b는 유의하다

 

6) 회귀식 y=-8.736+ 1.116x

 

 

7)  비표준화, 비표준화 선택

 

 

 

 

 

 

 

 

 

 

728x90