본문 바로가기

STUDY/확률과 통계

[ProDS] 1. 확률의 개념과 특징.

본 포스팅은 ProDS 필기 강의를 듣고 정리, 요약한 내용입니다.

  - 확률의 개념과 특징

  • 통계학statistics : 데이터에 담긴 표면적인 정보를 정확히 요약하고, 담긴 의미를 추론하고 해석하기 위한 학문.
  • 모수parameter : 알고자 하는 미지의 정보. ex) 특정 후보의 지지율, 동물의 평균 수명, 온도, 불량률, etc.
  • 확률probability : 어떤 사건이 발생할 가능성을 0~1 사이의 숫자로 나타낸 것.
     
    1. 확률모형probabilistic model : 확률실험random experiment(시행을 반복할 때마다 나오는 결과가 매번 달라지는 현상or 실험)에 대한 수리적 모형을 뜻한다.

    2. 표본공간sample space : 확률실험에서 가능한 모든 사건의 결과의 집합. 보통 S로 나타낸다.

        ex) 동전 던지기 실험의 표본공간 $S = \left\{H, T \right\}$
        ex) 주사위 굴리기 실험의 표본공간 $S = \left\{1, 2, 3, 4, 5, 6 \right\}$

    3. 사건event : 표본공간 S의 임의의 부분집합. A, B, C ... 로 표기하고, 그 사건이 일어날 확률은 P(A), P(B), P(C), ...로 나타낸다.

      ex) 주사위에서 짝수가 나오는 사건 $A = \left\{2, 4, 6 \right\},\,P(A) =  \frac{1}{2}$


확률 정의 방법

1) P. Laplace의 고전적 정의Classical definition :

 표본공간 S의 원소가 n개고 각 결과의 가능성이 같은 경우, m개의 결과로 구성된 사건 A가 발생할 확률$$ P(A) =  \frac{m}{n}$$

 

2) 상대도수(빈도)에 의한 정의Relative-frequency definition

 n번 시행된 실험에서 사건 A가 발생한 횟수를 m이라고 할 때, A가 발생할 확률 $$P(A)= \displaystyle \lim_{ n\to \infty}\frac{m}{n} $$로 정의하며, 여기서 $\frac{m}{n}$ 사건 A의 상대도수(빈도)relative frequency라 한다.

 

 

확률의 3가지 공리

1) 임의의 사건 A에 대해 $P(A)\geq 0$

 

2) $P(S) = 1$

 

3) 표본공간 S에 정의된, 서로 상호배반(동시에 발생하지 않음)인 사건 A1, A2, ...에 대해 $$P(A_1 \cup A_2 \cup \cdots )=P(A_1)+P(A_2)+\cdots$$

 

 

조건부 확률conditional probability

 : 사건 A와 B가 표본공간 S에 정의돼있고, $P(A) >0$이며, 사건 B가 발생한 경우에 한해 사건 A가 발생할 확률 $$P(A|B)=\frac{P(A\cap B)}{P(B)}$$ * 곱사건의 확률 $P(A\cap B)$과 헷갈리지 말 것!

 

 

 

독립사건Independent events

 : $P(A)>0$, $P(B)>0$일 때, 사건 B를 전제하였을때의 A의 확률과 그냥 A의 확률이 같은 경우 A와 B는 독립사건이라 한다. B와 A를 바꿔도 마찬가지.
수식으로 보자면, 아래의 세 조건 중 하나를 만족시키는 경우, A와 B는 독립사건이라 한다.

   1) $P(A|B)=P(A)$

   2) $P(A\cap B)=P(A)\cdot P(B)$

   3) $P(B|A)=P(B)$

   사실 위 세 공식은 같은 공식이다. 위에서 본 조건부 확률 공식에 의해,

$$ P(A|B)=\frac{P(A\cap B)}{P(B)} = P(A)\quad \Rightarrow \quad P(A\cap B)=P(A) \cdot P(B) \quad \Rightarrow \quad P(B)=\frac{P(A\cap B)}{P(A)}=P(B|A) $$