본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.
모집단의 분포와 확률표본
- 모집단의 변수(확률변수) $X$의 확률분포함수를 $f(x)$로 가정했을 때, $f(x)$로부터의 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$은 다음의 두 가지 성질을 만족하는 표본을 뜻한다.
1) $X_1,\, X_2,\, \cdots ,\, X_n$은 서로 독립이다.
2) $X_1,\, X_2,\, \cdots ,\, X_n$은 모두 $f(x)$의 분포를 따른다.
통계량과 표본분포
1) 통계량 : 확률표본 $X_1,\, X_2,\, \cdots ,\, X_n$의 함수.
ex) 표본평균 $ \bar{X} = \sum_{i=1}^{n} \frac{X_i}{n},\quad E(\bar{X})=\mu,\quad V(\bar{X})=\frac{\sigma^2}{n} $
2) 표본분포$Sampling\, Distribution$ : 통계량의 확률분포
표본 추출방법
- 단순 임의 추출법$Simple\, Random\, Sampling(SRS)$
1) 모집단을 구성하는 모든 원소에 대해, 표본으로 추출될 확률을 동일하게 만드는 추출법.
2) $N$개의 원소로 구성된 모집단에서 $n(\leq N)$개의 표본을 추출할 때 모든 원소에 1, $\cdots,\, N$ 번호를 부여하고, 그 중에서 $n$개의 번호를 무작위로 선택해서 추출한다.
- 계통 추출법$Systematic\, Sampling$
1) $N$개의 원소로 구성된 모집단에서 $n(\leq N)$개의 표본을 추출할 때 모든 원소에 1, $\cdots,\, N$ 번호를 부여하고, 순서대로 나열한다.
2) 나열된 원소들을 $k(=\frac{N}{n})$개씩 $n$개의 구간으로 나눈다.
3) 첫 구간에서 k개의 원소 중 하나를 선택하고, 이후 구간에서는 같은 위치의 원소를 택해 표본으로 추출한다. => 주기를 갖는 자료엔 적절하지 않다.
- 집락 추출법(=군집 추출/표집법)$Cluster\,Sampling$
: 모집단이 군집으로 되어 있는 경우, 특정 군집을 무작위로 선택한 후 각 군집에서 표본을 무작위로 추출.
- 층화 추출$Stratified\, Sampling$
: 모집단 원소들을 비슷한 것들끼리 모아 층$stratum$을 만들고, 각 층에서 표본을 무작위로 추출.
'STUDY > 확률과 통계' 카테고리의 다른 글
[ProDS] 12. 가설검정의 원리 (0) | 2023.08.07 |
---|---|
[ProDS] 11. 점추정과 구간추정 (0) | 2023.08.04 |
[ProDS] 9. 수치적 기술통계 - 2) 연관성 (0) | 2023.07.31 |
[ProDS] 8. 수치적 기술통계 - 1) 위치, 변이, 모양통계량 (0) | 2023.07.31 |
[ProDS] 7. 그래프에 의한 기술통계 (0) | 2023.07.31 |