貝葉斯定理的定義和例子

貝葉斯定理是用于概率和統(tǒng)計的數(shù)學(xué)方程式,用于計算條件概率。換句話說,它用于基于事件與另一個事件的關(guān)聯(lián)來計算事件的概率。該定理也稱為貝葉斯定律或貝葉斯定律。

歷史

貝葉斯定理以英國大臣兼統(tǒng)計學(xué)家托馬斯·貝葉斯牧師的名字命名,貝葉斯定理為其工作“解決機會論中的問題的論文”制定了一個等式。在貝葉斯死后,該書稿由理查德·普賴斯(Richard Price)在1763年出版之前進行了編輯和更正。將定理稱為貝葉斯-普賴斯定律會更準確,因為普里斯的貢獻很重要。該方程的現(xiàn)代公式是由法國數(shù)學(xué)家Pierre-Simon Laplace在1774年設(shè)計的,他當時并不知道貝葉斯的工作。拉普拉斯被認為是負責(zé)貝葉斯概率發(fā)展的數(shù)學(xué)家。

 

貝葉斯定理的公式

有幾種不同的方法可以為貝葉斯定理編寫公式。最常見的形式是:

P(A ∣ B)= P(B ∣ A)P(A)/ P(B)

其中A和B是兩個事件,P(B)≠0

P(A ∣ B)是在事件B成立的情況下事件A發(fā)生的條件概率。

P(B∣A)是假設(shè)A為真的事件B發(fā)生的條件概率。

P(A)和P(B)是A和B彼此獨立出現(xiàn)的概率(邊際概率)。

 

例子

如果您患有花粉癥,您可能希望找到一個人患類風(fēng)濕性關(guān)節(jié)炎的可能性。在此示例中,“發(fā)生花粉癥”是對類風(fēng)濕關(guān)節(jié)炎(事件)的測試。

  • 一個是事件“患者患有類風(fēng)濕性關(guān)節(jié)炎。” 數(shù)據(jù)表明,診所中10%的患者患有這種類型的關(guān)節(jié)炎。P(A)= 0.10
  • B是測試“患者有花粉癥”。數(shù)據(jù)表明,診所中有5%的人患有花粉癥。P(B)= 0.05
  • 診所的記錄還顯示,類風(fēng)濕關(guān)節(jié)炎患者中有7%患有花粉癥。換句話說,考慮到患有類風(fēng)濕性關(guān)節(jié)炎,患者發(fā)生花粉癥的可能性為7%。B∣A = 0.07

將這些值插入定理:

P(A ∣ B)=(0.07 * 0.10)/(0.05)= 0.14

因此,如果患者患有花粉癥,則其患類風(fēng)濕性關(guān)節(jié)炎的機會為14%。花粉癥的隨機患者不太可能患有類風(fēng)濕關(guān)節(jié)炎。

 

敏感性和特異性

貝葉斯定理很好地證明了醫(yī)學(xué)檢驗中假陽性和假陰性的影響。

  • 靈敏度是真實的陽性率。它是正確識別的陽性比例的一種度量。例如,在妊娠試驗中,妊娠試驗陽性的婦女所占的百分比。敏感的測試很少會遺漏“陽性”。
  • 特異性是真實的陰性率。它測量正確識別的負片的比例。例如,在妊娠試驗中,妊娠試驗陰性的女性中未懷孕的百分比。特定的測試很少會出現(xiàn)誤報。

完美的測試將是100%敏感和特定的。實際上,測試的最小錯誤稱為貝葉斯錯誤率。

例如,考慮一種靈敏度為99%且特異性為99%的藥物測試。如果有一半(0.5%)的人使用毒品,那么一個隨機檢測結(jié)果為陽性的人實際上是使用者的概率是多少?

P(A ∣ B)= P(B ∣ A)P(A)/ P(B)

也許改寫為:

P(用戶∣ +)= P(+用戶)P(用戶)/ P(+)

P(用戶+)= P(+用戶)P(用戶)/ [P(+用戶)P(用戶)+ P(+非用戶)P(非用戶)

P(用戶∣ +)=(0.99 * 0.005)/(0.99 * 0.005 + 0.01 * 0.995)

P(用戶∣ +)≈33.2%

只有約33%的時間隨機測試陽性的人實際上是吸毒者。結(jié)論是,即使一個人對藥物測試呈陽性反應(yīng),它更可能他們根本使用藥物比他們做的。換句話說,假陽性的數(shù)量大于真陽性的數(shù)量。

在現(xiàn)實世界中,通常要在敏感性和特異性之間做出權(quán)衡,這取決于不要遺漏陽性結(jié)果是否更重要,還是將陰性結(jié)果標記為陽性是否更好。