二項分布的預期值
二項式分布是一類重要的離散概率分布。這些類型的分布是一系列n獨立的伯努利試驗,每個試驗都有恒定的成功概率p。與任何概率分布一樣,我們想知道它的意思或中心是什么。為此,我們真的在問:“二項分布的預期值是多少?”
直覺與證明
如果我們仔細考慮二項式分布,則不難確定此類概率分布的期望值為np。有關此示例的一些快速示例,請考慮以下內容:
- 如果我們折騰100個硬幣,并且X是頭的數量,則X的期望值是50=(1/2)100。
- 如果我們正在進行20個問題的多項選擇測試,每個問題有四個選擇(只有一個是正確的),那么隨機猜測意味著我們只希望得到(1/4)20=5個問題是正確的。
在這兩個例子中,我們看到E[X]=n p。有兩個案例幾乎不足以得出結論。雖然直覺是指導我們的好工具,但形成數學論證并證明某些事情是真實的還不夠。我們如何確定地證明這種分布的預期值確實是np?
從n成功概率試驗p的二項式分布的期望值和概率質量函數的定義,我們可以證明我們的直覺與數學嚴謹性的結果相匹配。我們需要在工作中謹慎一些,并且在操作組合公式給出的二項式系數時要靈活。
我們首先使用公式:
E[X]=∑nX C(n,X)pX(1-p)n–X。
由于每個t求和的erm乘以x,對應于x=0的項的值將為0,因此我們實際上可以寫:
E[X]=∑nX C(n,X)pX(1–p)n–X。
通過操縱C(n,x)表達式中涉及的因子,我們可以重寫
x C(n,x)=n C(n–1,x–1)。
這是真的,因為:
x C(n,x)=x n!/(x!(n數學常識-x)?。?n!/((x-1)?。╪-x)?。?n(n-1)!/((x-1)?。ǎ╪-1)-(x-1))!)=n C(n–1,x–1)。
由此可見:
E[X]=∑nn C(n–1,X–1)pX(1–p)n–X。
我們從上面的表達式中剔除了n和一個p:
E[X]=n p∑nC(n–1,X–1)pX–1(1–p)(n–1)-(X–1)。
變量140 r x-1141的變化給了我們:
(n-1,r)p 149 r 150(1-p)151(n-1)-r 152>。
通過二項式,(x+y)k=∑kC(k,r)xryk–r可以重寫上面的總和:
E[X]=(n p)(p+(1–p))n–1=np。
上述論點讓我們走了很長一段路。從二項分布的期望值和概率質量函數的定義開始,我們已經證明了我們的直覺告訴我們的。二項分布的期望值B(n,p)是n p。