| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 | 31 |
- 행렬의 곱셈
- 연속확률분포
- 다층 퍼셉트론
- 이산확률변수
- 역행렬
- 이산확률분포
- 경사하강법
- 의사결정나무
- 확률과 통계
- 서포트 벡터 머신
- 연속확률변수
- 내적
- 분류
- 선형회귀
- 결합확률
- 행렬
- 벡터
- 확률과통계
- 조건부확률
- 베이즈정리
- 최소제곱법
- 선형대수
- 확률
- 조합
- 머신러닝
- 신경망
- 정규분포
- 노름
- 엔트로피
- 퍼셉트론
- Today
- Total
데이터사이언티스트 성장기
04. 베이즈 정리 본문
베이즈 정리란 사건 A, B가 존재할 때 사건 B가 발생함으로서 기존의 사건 A의 확률이 어떻게 변하는가를 나타낸 정리입니다.
기존의 존재하던 사건 H가 일어날 확률을 P(H)라고 할 때, 이후 발생한 사건 E에 의해 사건 H가 발생할 확률이 P(H|E) 로 변하게 되는 현상을 구하게 됩니다.
베이즈 정리는 공식으로 나타내면 다음과 같습니다.
$$P(H|E) = {{P(H,E)}\over{P(E)}}= {{P(E|H)P(H)}\over{P(E)}}$$
여기서 기존의 존재하던 사건 H가 발생할 확률, 즉 사전확률을 P(H), 사건 E가 발생함으로서 변화된 H의 발생확률, 즉 사후확률을 P(H|E)라고 합니다.
예시를 통해 베이즈 정리 활용법을 알아보겠습니다.
10000명 중 1명이 걸리는 질병이 있다고 가정해보겠습니다. 이때 질병이 있는 경우를 양성, 없는 경우를 음성이라고 판단하는 의사의 정확도는 99%입니다. 앞선 상황에서 어떤 사람이 양성 판정을 받았는데 실제로 병에 걸렸을 확률을 구해보겠습니다.
위 상황에서 주어진 사건은 '질병에걸렸다'라는 사건이므로 이를 H로 두겠습니다.
또한 이후 발생한 사건을 '양성 판정을 받았다'라는 사건 E로 두겠습니다.
베이즈 정리에 무작정 대입해보기 앞서, 구하는 방식을 알아보겠습니다.
먼저 우리에게 주어진 확률은 다음과 같습니다.
병에 걸릴 확률 : 0.0001
병에 걸리지 않았을 확률 : 0.9999
정확히 판단한 경우 : 0.99
잘못 판단한 경우 : 0.01
우리는 사건 E, 즉 '양성 판정을 받았다'는 사건의 확률을 구하기 위해 이를 두 사건으로 분리하여 생각해볼 수 있습니다.
1. 병에 걸렸고 이를 양성으로 판단한 확률 ( = 병에 걸렸을 때 정확히 판단한 경우 )
2. 병에 걸리지 않았고 이를 양성으로 판단한 확률 ( = 병에 걸리지 않았을 때 잘못 판단한 경우 )
식으로는 다음과 같이 표현할 수 있습니다.
$$P(E) = P(E,H) + P(E,H^c) = P(E|H)P(H) + P(E|H^c)P(H^c)$$
따라서 양성으로 판단하는 사건 E의 확률은 0.99 X 0.0001 + 0.01 X 0.9999 = 0.010098 입니다.
이렇게 양성으로 판단하는 사건 E의 확률을 구했으니 이를 조건으로 하는 사건 H의 확률을 구해보겠습니다.
P(H,E) = P(H)P(E) = 0.0001 X 0.99 = 0.000099
따라서 P(H|E)는 0.000099 / 0.010098 = 약 98% 가 됩니다.
베이즈 정리 공식에 그대로 대입해 보아도 같은 결과가 도출되는 것을 알 수 있습니다.
$$P(H|E) = {{P(E|H)P(H)}\over{P(E)}} = {{P(E|H)P(H)}\over{[P(E|H)P(H) + P(E|H^c)P(H^c)]}}$$
출처 : 밑바닥부터 시작하는 데이터 과학 (조엘 그루스)
'수학 > 확률과 통계' 카테고리의 다른 글
| 03. 결합확률과 조건부확률 (0) | 2022.09.26 |
|---|---|
| 02. 확률분포 (0) | 2022.09.19 |
| 01. 확률 (0) | 2022.09.12 |