본문 바로가기

STUDY/확률과 통계

[ProDS] 12. 가설검정의 원리

본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.

통계적 가설검정

 : 표본으로부터 주어지는 정보를 가지고 모수에 대한 가설(= 모수에 대한 예상, 주장, 추측 등)이 옳은지 그른지 판정하는 과정,

 

가설

1) 귀무가설($H_0$) : 사실로 알려져 있는 가설. 별 문제가 없는 한 나타날 것으로 예상되는 현상에 대한 기존의 입장.

2) 대립가설($H_1$) : 표본자료로부터 입증하고자 하는 가설

     => 가설 검정은 표본의 정보가 귀무가설 $H_0$에 대한 충분한 반증이 되는가를 확인하는 것.

 

가설 유형

- 관심 모수가 $\mu$고, 검정하려는 모수의 경계값이 %\mu_0%일 때,

1) 왼꼬리 검정 - $H_0 : \mu = \mu_0,\; H_1 : \mu< \mu_0$

2) 오른꼬리 검정 - $H_0 : \mu = \mu_0,\; H_1 : \mu> \mu_0$

  * 1), 2)를 통틀어 단측검정이라 한다

3) 양측 검정 - $H_0 : \mu = \mu_0,\; H_1 : \mu \neq \mu_0$

 

검정통계량

: $H_0,\, H_1$중 하나를 택하는 기준을 정하는 통계량. 모집단이 '모분산이 알려진 정규분포'인 경우의 모평균 $\mu$에 관한 검정의 경우,

  표본평균 $\bar{X}$의 함수인 $$Z = \frac{\bar{X}-\mu}{\sigma/ \sqrt{n}}$$

  검정통계량의 표본분포는 $$ Z = \frac{\bar{X}-\mu}{\sigma/ \sqrt{n}} \sim N[0,\, 1] $$

  $H_0$이 채택되었을 때(=> $H_0 : \mu=\mu_0$일 때)

$$ Z_0 = \frac{\bar{X}-\mu_0}{\sigma/ \sqrt{n}} \sim N[0,\, 1] $$

 

귀무가설 $H_0$의 기각 여부를 판단하는 접근방식

1) 기각역(=$H_0$을 기각시키는 검정통계량의 관측치 영역)에 의한 검정

2) 유의확률에 의한 검정

* 1), 2) 둘 다 결론은 같다.

 

유의확률에 의한 검정법

- 유의확률$p-value$

  : $H_0$가 사실인 경우($H_0 : \mu=\mu_0$)의 검정통계량 분포에서 $H_1$방향으로 검정통계량 관찰값($Z_0 = \frac{\bar{X}-\mu_0}{\sigma/ \sqrt{n}}$)보다 더 크거나 작은 값이 나올 확률.

그 확률이 일정 값 이하면 $H_0$을 기각하고 $H_1$을 채택한다.

-  모분산 $\alpha^2$이 알려진 정규 모집단에서 모평균 $\mu$에 관한 검정의 경우, $H_0$가 사실일 때 구할 수 있는$Z_0$을 이용해서 계산.

 

 1) 왼꼬리 검정. $$H_0 : \mu = \mu_0,\quad H_1 : \mu<\mu_0 \quad  \Rightarrow \quad p-value = P(Z<Z_0)$$

 2) 오른꼬리 검정. $$H_0 : \mu = \mu_0,\quad H_1 : \mu>\mu_0 \quad  \Rightarrow \quad p-value = P(Z>Z_0)$$

 3) 양측 검정. $$H_0 : \mu = \mu_0,\quad H_1 : \mu\neq \mu_0 \quad  \Rightarrow \quad p-value = 2P(Z<Z_0)\; or\;  2P(Z>Z_0)$$

 

가설검정 오류

1) 제 1종오류$Type\, I\, error$ : $H_0$가 사실임에도 불구하고 기각하는 오류. 1종 오류를 범할 확률은 대개 $\alpha$, 혹은 $\alpha\, risk$라 한다.

2) 제 2종오류$Type\, II\, error$ : $H_0$가 거짓임에도 불구하고 채택하는 오류. 2종 오류를 범할 확률은 대개 $\beta$, 혹은 $\beta\, risk$라 한다.

 * 1종 오류와 2종 오류 중 1종오류가 더 위험한 것인데, 왜냐면 이미 알려져있는 사실을 부정하는 오류이기 때문!

3) 유의수준 : 제 1종 오류를 범할 확률의 최대치

 

유의수준$significant level$ 검정법

  : $\; p-value \leq \alpha \quad \Rightarrow \quad H_0\,$기각,  $H_1\,$ 채택