본문 바로가기

STUDY/확률과 통계

[ProDS] 10. 통계적 추론 개요, 표본추출법

본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.

모집단의 분포와 확률표본

 - 모집단의 변수(확률변수) $X$의 확률분포함수를 $f(x)$로 가정했을 때, $f(x)$로부터의 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$은 다음의 두 가지 성질을 만족하는 표본을 뜻한다.

   1) $X_1,\, X_2,\, \cdots ,\, X_n$은 서로 독립이다.

   2) $X_1,\, X_2,\, \cdots ,\, X_n$은 모두 $f(x)$의 분포를 따른다.

 

통계량과 표본분포

 1) 통계량 : 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$의 함수.  

      ex) 표본평균 $  \bar{X} = \sum_{i=1}^{n} \frac{X_i}{n},\quad E(\bar{X})=\mu,\quad V(\bar{X})=\frac{\sigma^2}{n} $

 2) 표본분포$Sampling\, Distribution$ : 통계량의 확률분포

 

표본 추출방법

 -  단순 임의 추출법$Simple\, Random\, Sampling(SRS)$

    1) 모집단을 구성하는 모든 원소에 대해, 표본으로 추출될 확률을 동일하게 만드는 추출법.

    2) $N$개의 원소로 구성된 모집단에서 $n(\leq N)$개의 표본을 추출할 때 모든 원소에 1, $\cdots,\, N$ 번호를 부여하고, 그 중에서 $n$개의 번호를 무작위로 선택해서 추출한다.

 

 -  계통 추출법$Systematic\, Sampling$

     1) $N$개의 원소로 구성된 모집단에서 $n(\leq N)$개의 표본을 추출할 때 모든 원소에 1, $\cdots,\, N$ 번호를 부여하고, 순서대로 나열한다.

     2) 나열된 원소들을 $k(=\frac{N}{n})$개씩 $n$개의 구간으로 나눈다.

     3) 첫 구간에서 k개의 원소 중 하나를 선택하고, 이후 구간에서는 같은 위치의 원소를 택해 표본으로 추출한다. => 주기를 갖는 자료엔 적절하지 않다.

 

  - 집락 추출법(=군집 추출/표집법)$Cluster\,Sampling$

  : 모집단이 군집으로 되어 있는 경우, 특정 군집을 무작위로 선택한 후 각 군집에서 표본을 무작위로 추출.

 

 - 층화 추출$Stratified\, Sampling$

  : 모집단 원소들을 비슷한 것들끼리 모아 층$stratum$을 만들고, 각 층에서 표본을 무작위로 추출.