이번 시간에는 SPSS 프로그램을 이용한 t-test 중 독립표본t검정을 다뤄보겠다.
역시나 본 포스팅은 이론 설명이 아니다.
여러분은 그대로 따라 클릭만 하면 된다.
해석 방법도 다 알려주겠다.
t-test는 쉽게 말해 평균을 통해 통계적으로 유의한 차이가 있는지를 보는 것이다.
이전 포스팅에서는 t-test 중 일표본t검정을 살펴보았다.
서로 독립적인 2개의 집단이 평균적으로 차이가 있는지를 보는 것
예: A반과 B반의 과학 성적은 차이가 날까?
A기업과 B기업에서 만드는 건전지 배터리 수명은 같은가?
A기업 제품 사용에 대한 20대 집단 vs 50대 집단 만족도 차이
일표본t검정과 독립표본t검정 차이
구분 | 일표본t검정 | 독립표본t검정 |
대상 | 1개 집단 | 독립적인 2개 집단 |
분석 | 특정 수치(예: 1L)가 맞는지 보는 것 | 두 집단의 수치(예: 점수)의 평균이 서로 다른지 보는 것 |
먼저, 2개의 집단 데이터가 있어야 한다.
본 포스팅에서는 A, B반 과학 성적을 예시로 하겠다.
예를 들어 A, B반의 과학 성적 차이를 보고 싶다면,
A, B반을 구분하는 변수 1개,
과학점수를 나타내는 변수 1개가 있어야 한다.
즉, 아래의 그림처럼 코딩해야 한다.
데이터 숫자만 봐서는 A, B반 중에서 어느 반이 더 높은지 판단하기 쉽지 않다.(지금 그림에는 A반만 캡처되어 있음)
검정 변수와 그룹화 변수 자리에 알맞은 변수를 옮겨야 한다.
다 옮긴 후 "그룹 정의"를 클릭한다.
검정 변수 자리 : 과학 성적 변수 옮기기
그룹화 변수 자리 : 반 변수 옮기기
그룹 정의를 클릭하면
작은 화면이 1개 생기는데,
그룹 1에는 1, 그룹 2에는 2를 입력한다. 그리고 계속을 클릭한다.
즉, 그룹 1에 1을 입력하는 것은 A반을 의미하고,
그룹 2에 2를 입력하는 것은 B반을 의미한다.
세팅이 모두 완료되었다.
다른 옵션이나 부트스트랩은 건들지 말자
사실 쓰는 용도가 따로 있긴 한데, 지금 여러분에겐 필요 없다.
바로 확인을 클릭하자
등분산을 가정함, 가정하지 않음이 있다.
초보자들은 여기서 멘붕이다.
잘 따라와 주자! 이제 설명 들어간다
등분산 개념은 여러분에게 중요치 않다.
그러니 등분산이 뭔가요?라고 묻지 말고 순수한 스펀지처럼 잘 따라 클릭해보자
등분산 = 분산이 서로 같다는 뜻
숫자 보고, 마지막 "그래서 두 집단의 OO은 같다/다르다" 해석만 잘하면 된다.
1) 등분산 가정부터 본다.
0.05 이상 뜨면 등분산을 가정함 라인(가로줄
= 그림에서는 붉은 점선 네모 박스)을 본다.
만약 등분산의 유의 수준이 0.05 미만이라면,
초록색 점선 네모 박스를 본다.
2) 유의 수준을 본다
유의 수준이 0.05 미만으로 나타나는지 확인한다.
무조건 0.05 미만이라고 좋은 것이 아님
연구 목적에 따라 다름
왜 무조건 좋은 것이 아니냐고?
생각해보자, 2개의 집단이 같아야 좋은 상황이 있고, 달라야 좋은? 상황이 있다.
극단적인 예인데, "홍길동" 과학 선생님은 A반이든 B반이든
같은 평균점수가 나오도록 균등하게 잘 가르치고 싶어 한다.
그런데, A반과 B반의 성적이 다르다면?
반마다 학생들의 과학 공부 질과 양이 다르던지
선생님이 학생들의 이해에 있어서 의도치 않게
특정 반을 잘 가르쳤던지와 같은
여러 생각을 하게 된다.
그러므로 이와 같은 상황에서는 평균의 차이가 안 나는 것이 좋은 상황이 된다.
분석 결과,
A반의 과학 성적 평균 : 73.47점
B반의 과학 성적 평균 : 71.35점
단순히 수로만 보면 차이가 난다고
생각할 수 있지만,
이러한 차이가 통계적으로 유의적인가를 살펴보면
말이 달라진다.
A, B반의 유의 수준을 보면 0.539로 나타났다.
0.05를 초과한 수이기 때문에
A, B반의 평균의 차이는 통계적으로 유의하지 않다고 해석한다.
즉, A, B반의 과학 성적은 차이가 없다.
분명 점수는 다른데
차이가 없다니, 신기하지 않은가?
경우에 따라서는 평균의 차이가 나는 것이 더 좋은 결과일 수 있다.
예: A기업에서 OO제품에 대해 20대에게 집중으로 마케팅하자는 의견을 내고 싶을 때
"20대와 50대의 만족도가 차이가 나더라, 20대의 만족도가 더 높더라"
"그러므로 우리의 한정된 마케팅 자원을 20대에 더 투자해야 한다."라는
결과가 뜨면 본인의 주장을 뒷받침해줄 수 있을 것이다.
댓글 영역