친구들!
유의수준과 유의확률이 같은 말일까?
그냥 대충 들으면 같아 보이는 단어지만 다르다(당연하겠지...;;)
핵심 개념 정리!!
1. 유의수준(α값 = 알파 값[혹시 기호 읽을 줄 모를까봐 ㅎㅎ 죄송 ㅠㅠ]) : 유의한지 아닌지를 판단하는 기준 값(=수준)
2. 유의확률(p값, p-value) : 해당 분석 결과 값(예: t-test, ANOVA, 회귀분석 등)이 유의할 확률
귀무가설이 맞는데, 오류(오해, 착각)로 인해 참인 귀무가설이 기각되고 연구자가 주장한 거짓 가설을 택할 확률
말이 좀 어렵지? 일단 눈물 닦고 "검은 글씨"만 이해해봐 ㅠㅠ
즉, 내가 무엇인가를 분석했는데,
이 결과 값이 유의성을 판단하는 기준 값(즉, 유의하다고 허용해줄 수 있는 값 = 유의수준) 안에
들어오느냐 아니냐(즉, 유의확률이 유의수준 값 안에 들어오냐 아니냐)를 보는 거야 ㅎㅎㅎ
먼저, 유의수준(α값)이 뭔가? 왜 보냐?
일단 가설의 종류(귀무, 대립)와 오류(1종, 2종)을 살펴보자
1종 오류(type I error, α error), 2종 오류(type II error, β error) 중 1종 오류 가 더 위험!!!
예를 보자~!
시나리오 : 어느 제약회사가 위암 치료를 위한 A약을 개발했다. 제약회사는 A약의 효과를 검증하기 위해 다음과 같은 연구를 진행한다.
이를 1종, 2종 오류에 대입해볼까?
1종 오류(type I error, α error) : A약은 위암 치료에 효과가 실제로 없지만, 연구자의 실수로 인해 효과가 있다고 판단을 내렸고, 환자 100명이 이 약을 사용했다.
2종 오류(type II error, β error) : A약은 위암 치료에 효과가 실제로 있지만, 연구자의 실수로 인해 효과가 없다고 판단을 내렸고, A약 생산 계획을 취소함
친구들, 1종 오류와 2종 오류 중 어느 것이 더 위험해 보이는가?
1종, 2종 오류 모두 피해(손실)는 존재한다.(1종 오류 : 환자들의 A약 복용 후 생길 부작용, 2종 오류 :회사가 A약에 투자한 비용)
하지만 더 위험한건 "1종 오류"이다.
그래서 1종 오류가 발생하는 수준(α값)이 가설 검증을 위해 사용된다.
보통 아래와 같은 3가지로 1종 오류가 발생하는 수준(=유의수준)을 구분한다.
0.05 = 5%
0.01 = 1%
0.001 = 0.1%
자~!
유의 확률은 이러한 1종 오류가 범해질(=발생할=착각할=선택할) 확률이다.
유의수준(α값)과 유의확률(p값 = p-value)을 그림으로 나타내면 아래와 같다.
아... 공들여서 만들었다. ㅎㅎㅎ
유의확률(p값 = p-value)은 사람으로, 유의수준(α값)은 장애물로 표현했다.
유의확률(p값 = p-value)이 유의수준(α값)보다 낮으면
즉, 유의수준(1종 오류를 허용 해줄 수 있는 마지노선) 보다 유의확률(1종 오류가 발생할 확률)이 낮다면
귀무가설은 기각되고 대립가설은 채택(지지)된다.
솔직히 친구들~!
지금까지 우리가
유의확률 유의수준을 그냥 편하게 섞어 썼잖아?(이런 제 자신을 반성합니다...)
이제는 정확하게 써보자구!(나에게 하는 말... ㅠㅠ)
자! 친구들~!!! 그러면 열공하고! 다음에 보자고!
궁금한 점 생기면 댓글 달아줘 ㅎㅎㅎ
내가 아는 거면 바로 답글 달고, 모르는 거면 찾아볼게 ㅎㅎㅎ
댓글 영역