(1) 오류값 찾기와 결측치 처리
1) 편집-찾기
해당데이터 입력 후 8찾기
2) 변수보기 창에서 결측값 없음 클릭 -> 이산형 결측값 8 입력
- 변수명 입력
- 문항, 변수, 내용, 결측치 처리 입력
- 결측치 처리란?
무응답을 컬럼 내의 지정된 수치로 입력
응답거부(98), 무응답(99) 둥으로 지정
- 결측치 처리 이유
실제 조사에서 100% 응답을 받아내기란 어려우므로, 무응답 한 부분의 경우 분석에서 자동 제거하여 분석함
100% 응답이 아닐 경우 자료 자체를 제거하기도 함
- 이상치와 오류값
이상치: 응답은 정확하나, 동떨어진 값 (예>한국 성인남자 키와 몸무게를 측정하는데, 최홍만 선수의 키와 몸무게가 있을 경우)
오류값: 응답범주 외의 수치가 입력된 경우 (예> 응답이 2번까지만 있는데 2이상의 3,4등이 입력된 경우)
- 무응답, 응답 거부의 처리
- 무응답, 응답거부를 결측치 처리(missing value)할 것인가? (예>결측값 “9”, “99”)
- 응답 자체에서 제거 할 것인가? 선택
(2) 역문항(역코딩) 처리
질문지를 만들 때 다른 문항들과 질문의 방향이 반대인 문항을 만들 수 있는데
이경우 해당 질문 항목에 대해서는 연산을 이용하여 역변환을 해주어야 한다
- 역코딩 확인
- 긍정이 최고점이 되도록 변환( 예>6-x1)반드시 결측, 이상치 처리 후
1) 역문항 찾아내기
2) 변환-변수계산
목표변수에 변수명 x14 입력
숫자표현식8-x14
역문항인 x14는 응답 범주가 7점 척도(1~7)이므로 부정적인 질문에 대한 응답을 긍정적인 응답으로 바꾸기위해서
(3) 문자 추출= 문자랑 숫자 텍스트 나누기
문자형 변수의 경우 분석에 필요한 문자만을 추출하여 해당 문자와 관련된 데이터에 대해 분석해야한다
<문자추출함수 char.substr 이용하는 방법 1>
1) 변환-변수 계산 =-자추출함수
2) 목표변수 입력 =WAY
함수집단: 모두-char.substr(3) 선택
3) char.substr(ID, 1, 1) 입력 및 문자 선택
char.substr( 변수명, 추출할 문자의 시작위치, 시작위치로부터 추출할 문자의 개수)
char.substr(ID, 1, 1)= ID변수의 첫번째문자에서 한문자를 추출
목표변수 입력 =AREA
char.substr( 변수명, 추출할 문자의 시작위치, 시작위치로부터 추출할 문자의 개수)
char.substr(ID, 2, 2)= ID변수의 두번째문자에서 두문자를 추출
'things > IT' 카테고리의 다른 글
ㅋㅎ 3 ㅁㅈ (0) | 2021.11.12 |
---|---|
ㅋㅎㅍㄱ 3 (0) | 2021.11.02 |
3. 상관분석, 회귀분석 (0) | 2021.10.21 |
2. 평균 비교_평균 분석, T검정(일표본,독립, 대응), 분산 분석(일원배치, 이원배치, 다원배치-> 사후분석) (0) | 2021.10.21 |
1. 기술통계량_빈도 분석, 기술 통계, 일원배치 분산 분석, 교차 분석 (0) | 2021.10.21 |