확률(Probability)
Last updated
Last updated
시간이 없어 집합, 확률, 확률의 성질은 ㅓㄴ ㅇㅇ건너뛰고 베이지안 확률론 부터 설명하겠다.
베이지안 확률을 접하기 전 결합확률(marginal probabilty)과 조건부확률(conditional probability)를 알아야 한다.
결합확률(joint probability)은 사건 와 가 동시에 발생할 확률이다. 즉, 사건(명제/주장) 도 진실이고 사건(명제/주장) B도 진실이므로 사건 와 B\cap B의 교집합의 확률을 계산하는 것과 같다.
결합확률과 대비되는 개념으로 결합되지 않는 개별 사건의 확률 또는 를 주변확률(marginal probability)이라 한다.
또한 B가 사실일 경우의 사건 A에 대한 확률을 사건 B에 대한 사건 A의 조건부 확률(conditional probability)이라고 하며 다음과 같이 표기한다.
이 조건부 확률의 값은 다음처럼 정의될 수 있다.
독립의 수학적 의미 는 사건 A와 사건 B의 결합확률의 값이 다음과 같은 관계가 성립할 때
두 사건 A와 B는 서로 독립(independent)이라고 정의한다.
독립인 경우 조건부확률과 원래의 확률이 같아짐을 알 수 있다. 이 때 B라는 사건이 발생여부에 관계없이 A에는 전혀 영향을 주지 않는 다는 것이다.
베이즈 정리는 데이터라는 조건이 주어졌을 때의 조건부확률을 구하는 공식이다. 베이즈 정리를 쓰면 데이터가 주어지기 전의 사전확률값이 데이터가 주어지면서 어떻게 변하는지 계산할 수 있다. 따라서 데이터가 주어지기 전에 이미 어느 정도 확률값을 예측하고 있을 때 이를 새로 수집한 데이터와 합쳐서 최종 결과에 반영할 수 있다. 데이터의 개수가 부족한 경우 아주 유용하다.