things/IT

SPSS 작업형 실습공부_(1)~(5)

ooook 2021. 10. 13. 10:53
728x90

 

 

 

 

 

 

2019_01_16_01_승강기사고자료.txt
2.50MB

 

 

 

 

 

https://youtu.be/Fp9JdQsd__Y

 

 

사회조사분석사 2급 작업형 실습 첫번째 동영상입니다.

반드시 1-5의 사용자 이름 영문으로 되어야 합니다.

수록내용:

1. 데이터 다운로드

 

2. SPSS 옵션 설정

 

4단계: 탭만 체크하고 공백이랑 콤마는 해제

 

3. 데이터 불러오기

 

3-1. 인코딩 변경 후 불러오기 (데이터 불러오기 오류 해결법 포함)

 

3-2. 메모장에서 불러오기

Ctrl A +, Ctrl + C => 우클릭 후 변수명 붙여넣기

 

4. 변수보기를 활용한 소수점 변경 및 유의점

문자너비는 50으로

수치형 데이터는 소수점 2으로 바꾸기

 

 

 

https://youtu.be/-2Uw2kC45dU

 

 

사회조사분석사 2급 작업형 실습 두번째 동영상입니다.

 

수록내용:

1. 빈도분석 (빈도분석 시 유의점)

 

출력결과

 

 

ㄴ> 운행층수=연속형 변수이므로 빈도분석으로 결과 도출어려움

 

 

 

2. <0.001로 나올때 해결하기 03:51

 

더블클릭->드래그 잡아댕긴 상태에서오른쪽 더블 클릭하면

소수점 끝까지 확인하여 이걸로 답안작성하기

 

 

3. 결과표에서 소수점 변경하기 04:40

 

1)드래그 후 오른쪽 마우스 클릭-> 셀 특성-형식값-소수점 이하 조정

2)표에서 길이 늘리기

 

4. 결과표 행렬변경(피벗) 하기 05:40

더블클릭 -> 피벗- 행열전치

 

 

 

5. 기술통계와 빈도분석 차이점 06:24

 

빈도분석: 사분위수  구하기O, 문자형은 화면상에 출력O

기술통계: 사분위수  구하기X, 문자형은 화면상에 출력X

 

분석-기술통계량-기술통계

 

변수설정-> 옵션 -> 표준화 값을 변수로 저장(Z) 

새롭게 표준화를 새롭게 생성

변수보기의 측도부분은 손대지 않아도된다

 

표준편차/평균을 구하려고 할때

1) 드래그 후 해당 부분 복사 후 새로운 데이터 파일에 붙여넣기

 

 

 

 

 

 

6. 결과표 피벗 변경 실습 및 활용하기 07:45

 

컬럼과 컬럼으로 구성해야하므로 피벗으로 행열바꾸기해야함

 

 

7. 변수계산 시 소수점 증가해야 하는 이유 09:33

 

 

8. 변수계산 실습하기 (변동계수 산출) : 12:35

 

변환-변수계산

목표변수에 변동계수로 기록하고

  • 표준편차가 위이므로 숫자표현식(E)에 표준편차 넣기
  • 평균이 밑이므로 유형 및 레이블(L)에 평균 넣기

 

 

 

 

 

https://youtu.be/fsa6yJZtcNA

 

사회조사분석사 2급 작업형 실습 세번째 동영상입니다.

 

수록내용:

1. 텍스트 나누기

 

해당 부분을 복사한 후

다른 곳에 붙여넣기

숫자형-> 문자형으로 변경

 

 

1-1. char.substr(3): 두 해당연도 사이

 

목표변수: year

함수집단: 모두-char.substr(3) 선택

각각 ?부분에 채우기 

 

유형 레이블-문자로 변환 후, 너비를 20으로 변환

 

문자형-> 숫자형으로 변경하면

계산이 가능한 숫자형

 

 

1-2. char.substr(2): 해당되는 연도 이후

 

다시 계산식을 만들 때

변환-변수 계산 재설정

목표변수: date

함수집단: 모두-char.substr(2) 선택

5번째이후 컬럼부터 쭉

 

유형 레이블-문자로 변환 후, 너비를 20으로 변환

 

숫자순서 유의하기 R은 0부터 시작

 

재설정 후

목표변수: month

함수집단: 모두-char.substr(3) 선택

 

 

원래대로는 좌로 밀착숫자로 변환하면 우로 밀착

 

2. 텍스트 합치기 07:45 

 

2-1. concat

 

변수와 변수합치기/자르기= 변수를 문자로 바꿔서 합쳐야함

변환-변수계산-재설정

뒤에 부분이 다 잘나오지 않는 경우

문자형 자릿수 50까지 늘린다

 

 

그래도 잘  안나타나는 경우는 해당 부분에 

문자외에 다른 것이 들어갔기 때문이므로

 

 

2-2. concat rtrim 10:05

 concat rtrim=오른쪽에 있는 해당 문자외에의 것을 제거한다

 

 

_ 언더바로 구분하고 싶으면

concat(rtrim(Q8_승강기_분류), '_',  Q9_운행층수분류)

 

SPSS 에서 중요한 것은
투입된 데이터의 오른쪽 빈공간을 없애는 것이 중요하다

 

 

 

 

3. 교차분석 11:52

질적자료 &질적자료 => 교차분석 실행 가능

분석-기술통계량-교차분석

 

 

3-1. 행 % 12:40

 

통계량-카이제곱 무조건 체크 후,

셀- 퍼센트에서 '행'선택 

 

 

 

 

승강기를 기준으로 

시험에서는 행이 100으로 나오던지

컬럼이 100으로 나오던지 맞춰서 나올 것

 

 

통계량-카이제곱 무조건 체크 후,

셀- 퍼센트에서 '행'선택 

 

 

행 퍼센트

 

3-2. 열 % 13:20

 

 

 

열 퍼센트

 

 

승객용을 100으로 놓고

층수가

 

 

카이제곱 검정을 살펴보았을 때,

행열의 위치를 바꾸더라도

검정통계량이 0.00이므로

독립이다

 

 

 

https://youtu.be/U7n5cfkmzV8

사회조사분석사 2급 작업형 실습 네번째 동영상입니다.

수록내용:

1. 독립표본 t검정

분석-평균비교-독립표본T검정

양적인 자료가 아닌 경우에는 분산분석과 독립표본t검정이 불가하므로

양적인 자료, 즉 숫자자료로 변환해야함

 

1:1로 변환> 자동코딩변경(가나다 순으로 정렬되므로 혼란스러움)

 

2. 다른변수로 코딩 변경 01:45

변환- 다른 변수로 코딩변경

문자변수->출력변수 부분에 Q8넣고

출력변수 이름 설정

 

해당부분 빈도분석 먼저 출력해야함

 

분석-기술통계량-빈도분석

 

 

화면상에 해당하는 부분 확인하면서 입력

01. 승객용

02. 승객용 제외

 

 

2-1. 다시 문자형의 숫자형 변경
(다른변수로 코딩변경, 시스템 또는 사용자 결측값) 03:00

 

값부분에 01. 승객용 새로운 값부분에 1

값부분에 02. 승객용 제외 새로운 값부분에 2

 

마지막에 기존값과 새로운 값 모두에 시스템 결측값으로 설정하기

 

Q8_1의 값 레이블을 설정하는데

1 =승객용

2=승객용 제외 로 설정

 

2-2. 문자형 표기를 숫자형으로 변경 04:20

데이터 보기로 했을 때

왼쪽 그림처럼 문자형으로 나온다면 해당부분 클릭하여 숫자형으로 변경가능함

 

2-3. 자동 코딩 변경 04:35

  • 너무 많은 경우
  • 이미 가나다순으로 정렬되어있는 경우

변환-자동코딩변경

 

변수-> 새 이름 설정

값 레이블 부분에

변수가 알아서 들어가있음

변수변환이 안된다면 문자형으로 되어있는지 확인하기

 

3. 일표본 t검정 06:15

 

정말 운행층수가 평균적으로 10층이냐를 확인하기

분석-평균비교-일표본 T검정

 

 

 

3-1. 주어진 검정 기준 06:30

귀무가설: 10이다

대립가설: 10이 아니다 으로 설정했을 때

유의확률 0.000으로 귀무가설은 기각된다

 

평균 9.2층

 

3-2. <0.001로 표기될 경우 해결법 07:35

 

해당부분을 더블클릭하면

자세한 갑이 나오며

숫자E-숫자 형태는 0.000이라고 할 수 있다

 

3-2. 신뢰구간 구하기 (신뢰구간 설정하는 방법, 이유) 09:00

신뢰구간은 신뢰구간을 구하라고 할 때만 구하기

 

분석-평균비교-일표본T검정으로 들어가서

 

검정값을 0으로 설정하고신뢰구간을 90%으로 변경

 

90% 신뢰구간

 

 

4. 독립표본 t검정 09:50

독립표본t검정: 두 개 이상의 집단간의 평균비교

일원배치분산분석: 세 개 이상의 집단 간의 평균비교

 

분석-평균비교-독립표본T검정

 

집단변수: Q8_1(운행층수)로 설정한 후

집단정의-지정값 사용

집단1: 1

집단2: 2

 

검정 변수: Q6_정격속도

신뢰구간은 시험문제에 주어지지않은 경우 바꿀 필요 없음

 

해당부분 더블클릭한다음

셀 형식-숫자 & 소수점 셋째자리 이하로 설정

 

 

답은 무조건 셋째자리로 구하기

 

0.000이므로 등분산이 가정X 

등분산을 가정하지 않음= 이분산

 

아래부분으로 해석해야함

유의확률 구해야한다

 

과거 버전은 양측검정만 나오는데

해당부분을 복사하여 새로운 파일에 소수점 여섯째자리까지로 설정한다

소수점 여섯째자리까지 해서 나온 후

변환-변수 계산

목표변수: 나누기

/2로 

 

소수점 셋째자리로 변경하여 값구하기 

 

4-1. 단측검정 계산법 12:20

 

새로운 버전은

양측검정(확률)과 단측 검정(확률)이 알아서 구해짐

새로 구할 필요가 없음

 

 

5. (일원배치)분산분석 13:20

분석-평균비교-일원배치 분산분석

 

요인부분에 Q9_운행층수분류

종속변수부분에 Q6_정격속도

 

옵션에서

  • 기술통계
  • 분산 동질성 검정

 

평균, 표준오차 등의 결과 도출

분산의 동질성 검정은 맨위만 확인하면 된다

 

귀무가설: 층별에 따라서 정격속도는 차이가 없다

대립가설: 최소한 하나는 층별에 따라서 정격속도는 차이가 있다

 

유의확률 0.000이므로 귀무가설은 기각 

 

사후분석

다시 분석-평균 비교- 일원배치 분석분석창으로 들어가서

사후분석에서 

Scheffe, Turkey 방법, Turkeydml b 3가지 체크 후

영가설 검정에서 사후분석 검정에 대한 유의수준 지정을 확인하고 

 

 

동질적 부분집합으로 결과 도출

층이 높아질수록 정격속도가 높아진다

집단간이 확실히 정격속도가 다르다

 

 

6. 평균비교 15:45

 

일원배치분산분석-옵션-기술통계로

해당되는 기술통계량을 구할 수 있음

 

 

해당하는 응답건수 2만여개의 부분 건수들을 구할 수 있음

 

 

Q7_운행층수를 탑승할 수 있는 인원수라고 가정한다면,

최종적인 합계를 구하는 것이 달라짐

 

일원배치= 운행층수의 각각의 평균으로 나온다

 

Q7을 명수라고 생각하고 구하려면

분석-평균 비교-평균 분석

 

독립변수: Q9_운행층수분류

종속변수: Q7_운행층수

옵션-셀통계량을

  • 합계
  • 전체 합계의 퍼센트
  • 케이스 수
  • 전체 N의 퍼센트
  • 평균

해당 결과 평균이 3.47층으로 도출

이를 분산분석표랑 비교하면

 

분석-평균 비교- 일원배치 분산분석

 

 

각 해당하는 부분의 합계와

전체합계의 비율을 구하려면

 

평균비교-평균 분석을 활용해야함

 

 

 

 

 

 

 

 

6-1. 분산분석과
평균 비교(일원배치 분산분석) 차이점

 

 

 

 

 

 

https://youtu.be/6f9Y4T1f-zU

 

사회조사분석사 2급 작업형 실습 다섯번째 기본 마지막 동영상입니다.

수록내용:

 

1. 텍스트 나누기 00:47

 

변환-변수계산

재설정을 누른다음

목표변수: Q1_1

유형 및 레이블 문자로 설정하 후 50으로 변경

 

 

 

Q1_1을 숫자계산을 하기위해 변수보기에서 숫자형으로 변경

 

1-1. 숫자형의 나누기 (원 단위를 천원 단위로) 02:22

변수-변수변환 

/1000으로 나누고 소수점 셋째자리로 변경

 

 

 

 

최솟값 최댓값 도출

분석-기술통계량-빈도분석

빈도분석 통계량을 평균, 최솟값, 최댓값

 

분석결과

변수보기에서 소수점이 없는 상태에서 똑같이 빈도분석을 돌리면

유효값이 000000

 

다시 빈도분석을 돌리는데 빈도표 표시 빼고 돌림

 

 

 

2. 집단 재분류 03:40

 

 

2-1. 평균 기준으로 재분류 03:40

 

평균값보다 작은면 1

평균값보다 크면 2로 그룹분류

 

셀 형식에서 소수점 8번째자리로 변경

평균 2.03489661 도출

이를 기반으로

0~2.03489661까지는 1그룹

2.03489661~최댓값18까지는 2그룹

 

2-2. 다른 변수로 코딩 변경 06:35

변환-다른변수로 코딩변경

재설정한 후 재긓룹

 

 

숫자변수-> 출력변수

Q1_2     ->Q1_3

범위: 0에서  2.034896까지

범위: 2.034896에서  값:18까지

 

 

Q1_3을 빈도분석을 돌리면

 

1집단이 더 많이 차지하믈 알 수 있다

 

 

3. 상관분석 08:15

분석-상관분석-이변량 상관

변수: Q6_정격속도, Q7_운행층수, Q1_1로 설정한 후

옵션에서 평균과 표준편차, 대응별 결측값 제외 체크

 

 

3-1. 상관분석 해석하기 09:17

결과로 기술통계량

 

 

상관통계량

3-2. 상관분석 * 표기 해석 10:00

0.05보다 작으면 *

0.01보다 작으면 **

 

절대값기준이다

 

 

3-3. <0.001로 표기될 경우 해결법 11:00

 

P(0.000)값을 보면

Q6_정격속도와 Q7_운행층수간은 관련성이 있고

상관강도도 매우높다

 

상관관계는 있으나 해당되는 계수값의 강도는 매우 약하다

 

어떤 값을 기준으로 할 지에 따라 크게 달라짐

꼭 절대값기준으로 해석해야한다!!!!

 

 

4. 케이스 선택 12:05

데이터-케이스 선택

 

 

4-1. 케이스 선택의 한계점 12:20

숫자형이 아니면 지정할 수 없음

최신부분을 대각선으로 케이스선택했는지 뜨지가 않아 어느부분을 케이스 선택을 했는지 헷갈리게 된다

 

4-2. 케이스 선택 후 / 표기 안나올 경우 12:40

마우스 우클릭 후 케이스선택이 보이게 선택해야함

 

5. 가급적이면 파일분할 14:45

집단들 비교, 각 집단별 출력 결과 차이점

데이터-파일분할-  각 집단별로 출력결과를 나타냄

 

 

분석-평균비교- 일원배치 분산분석

 

분석결과

각 집단별로 출력결과 나타냄=> 승객용랑 승객용 제외 따로 출력

 

 

데이터-파일분할- 집단들 비교를 체크하고

다시 분석-평균 비교- 일원배치 분산분석 

 

사후분석은 제거& 옵션-기술통계 체크

 

 

 

 

 

728x90