본문 바로가기
things/IT

4. 데이터 연산 및 문자 변수 추출

by ooook 2021. 10. 21.
728x90

 

 

(1) 오류값 찾기와 결측치 처리

 

1) 편집-찾기

해당데이터 입력 후 8찾기

 

2) 변수보기 창에서 결측값 없음 클릭 -> 이산형 결측값 8 입력

 

  • 변수명 입력

-      문항, 변수, 내용, 결측치 처리 입력

 

-      결측치 처리란?

무응답을 컬럼 내의 지정된 수치로 입력

응답거부(98), 무응답(99) 둥으로 지정

 

-      결측치 처리 이유

실제 조사에서 100% 응답을 받아내기란 어려우므로, 무응답 한 부분의 경우 분석에서 자동 제거하여 분석함

100% 응답이 아닐 경우 자료 자체를 제거하기도 함

 

-      이상치와 오류값

이상치: 응답은 정확하나, 동떨어진 값 (>한국 성인남자 키와 몸무게를 측정하는데, 최홍만 선수의 키와 몸무게가 있을 경우)

오류값: 응답범주 외의 수치가 입력된 경우 (> 응답이 2번까지만 있는데 2이상의 3,4등이 입력된 경우)

 

  • 무응답, 응답 거부의 처리

-      무응답, 응답거부를 결측치 처리(missing value)할 것인가? (>결측값 “9”, “99”)

-      응답 자체에서 제거 할 것인가? 선택

 

 

(2) 역문항(역코딩) 처리

질문지를 만들 때 다른 문항들과 질문의 방향이 반대인 문항을 만들 수 있는데

이경우  해당 질문 항목에 대해서는 연산을 이용하여 역변환을 해주어야 한다

 

  • 역코딩 확인

-      긍정이 최고점이 되도록 변환( >6-x1)반드시 결측, 이상치 처리 후

 

1) 역문항 찾아내기

2) 변환-변수계산

 

목표변수에 변수명 x14 입력

숫자표현식8-x14

역문항인 x14는 응답 범주가 7점 척도(1~7)이므로 부정적인 질문에 대한 응답을 긍정적인 응답으로 바꾸기위해서

 

 

 

(3) 문자 추출= 문자랑 숫자 텍스트 나누기

 

문자형 변수의 경우 분석에 필요한 문자만을 추출하여 해당 문자와 관련된 데이터에 대해 분석해야한다

 

 

<문자추출함수 char.substr 이용하는 방법 1>

 

1) 변환-변수 계산 =-자추출함수

2) 목표변수 입력 =WAY

함수집단: 모두-char.substr(3) 선택

 

3) char.substr(ID, 1, 1) 입력 및 문자 선택

 

char.substr( 변수명, 추출할 문자의 시작위치, 시작위치로부터 추출할 문자의 개수)

char.substr(ID, 1, 1)= ID변수의 첫번째문자에서 한문자를 추출 

 

목표변수 입력 =AREA

char.substr( 변수명, 추출할 문자의 시작위치, 시작위치로부터 추출할 문자의 개수)

char.substr(ID, 2, 2)= ID변수의 두번째문자에서 두문자를 추출 

 

 

 

 

 

 

 

 

 

 

 

 

728x90