조건부 확률이란 주어진 사건(B)이 일어났다는 가정 하에 다른 한 사건(A)이 일어날 확률(P or Pr)을 뜻하며, P(A|B)로 표기한다. 이 때 사건 A가 발생할 확률은 B에 따라 달라진다.
자연어 처리에서 조건부 확률은 언어 모델에서 적합한 단어를 추론하는데 사용될 수 있다. 예를 들어 "나는 학교에 ( )." 라는 문장에서 괄호 안에 어떤 단어가 들어가는 것이 가장 확률이 높은지 등을 파악할 때 사용될 수 있다.
조건부 확률에 나타나는 사건과의 상관 관계를 수식으로 표현하면 다음과 같다.
P(B) = B 사건이 발생할 확률
P(A) = A 사건이 발생할 확률
P(A∩B) = P(A,B) = P(A)P(B|A) = B 와 A 사건이 모두 발생할 확률
P(A|B) = P(A∩B)/P(B) = B 사건이 발생하고 A 사건이 발생할 확률
P(A,B,C,D) = P(A)P(B|A)P(C|A,B)P(D|A,B,C) = D, C, B, A 사건이 모두 발생할 확률 (조건부 확률의 연쇄법칙)
P(x1,x2,x3...xn) = P(x1)P(x2|x1)P(x3|x1,x2)...P(xn|x1...xn-1)
예제1)
전체 중고차 중 70% 가 에어컨이 있고,
전체 중고차 중 40% 가 CD 플레이어가 있다.
전체 중고차 중 90% 가 둘 중 하나 이상을 가지고 있다.
에어컨이 없는 중고차 중 CD 플레이어도 없을 확률은?
에어컨이 없는 중고차 P(B) 중 CD 플레이어도 없는 중고차 P(A) 의 확률 P(A|B)
---------------------------------------------------------------------
공식 P(A|B) = P(A,B)/P(B)
P(B) = 에어컨이 없을 확률 = 0.3
P(A,B) = 둘다 없는 확률 = 0.1
P(A|B) = P(A,B)/P(B) = 0.1 / 0.3 = 1/3
예제2)
"An adorable little boy is spreading smiles" 문장의 확률은?
(문장의 확률은 이전 단어로부터 다음 단어가 등장할 확률들의 곱으로 구성된다.)
---------------------------------------------------------------------
공식 P(x1,x2,x3...xn) = P(x1)P(x2|x1)P(x3|x1,x2)...P(xn|x1...xn-1)
P(An adorable little boy is spreading smiles) =
P(An)×
P(adorable|An)×
P(little|An adorable)×
P(boy|An adorable little)×
P(is|An adorable little boy)×
P(spreading|An adorable little boy is)×
P(smiles|An adorable little boy is spreading)
WRITTEN BY
- 손가락귀신
정신 못차리면, 벌 받는다.