二項(xiàng)分布的預(yù)期值
二項(xiàng)式分布是一類重要的離散概率分布。這些類型的分布是一系列n獨(dú)立的伯努利試驗(yàn),每個(gè)試驗(yàn)都有恒定的成功概率p。與任何概率分布一樣,我們想知道它的意思或中心是什么。為此,我們真的在問:“二項(xiàng)分布的預(yù)期值是多少?”
直覺與證明
如果我們仔細(xì)考慮二項(xiàng)式分布,則不難確定此類概率分布的期望值為np。有關(guān)此示例的一些快速示例,請(qǐng)考慮以下內(nèi)容:
- 如果我們折騰100個(gè)硬幣,并且X是頭的數(shù)量,則X的期望值是50=(1/2)100。
- 如果我們正在進(jìn)行20個(gè)問題的多項(xiàng)選擇測(cè)試,每個(gè)問題有四個(gè)選擇(只有一個(gè)是正確的),那么隨機(jī)猜測(cè)意味著我們只希望得到(1/4)20=5個(gè)問題是正確的。
在這兩個(gè)例子中,我們看到E[X]=n p。有兩個(gè)案例幾乎不足以得出結(jié)論。雖然直覺是指導(dǎo)我們的好工具,但形成數(shù)學(xué)論證并證明某些事情是真實(shí)的還不夠。我們?nèi)绾未_定地證明這種分布的預(yù)期值確實(shí)是np?
從n成功概率試驗(yàn)p的二項(xiàng)式分布的期望值和概率質(zhì)量函數(shù)的定義,我們可以證明我們的直覺與數(shù)學(xué)嚴(yán)謹(jǐn)性的結(jié)果相匹配。我們需要在工作中謹(jǐn)慎一些,并且在操作組合公式給出的二項(xiàng)式系數(shù)時(shí)要靈活。
我們首先使用公式:
E[X]=∑nX C(n,X)pX(1-p)n–X。
由于每個(gè)t求和的erm乘以x,對(duì)應(yīng)于x=0的項(xiàng)的值將為0,因此我們實(shí)際上可以寫:
E[X]=∑nX C(n,X)pX(1–p)n–X。
通過操縱C(n,x)表達(dá)式中涉及的因子,我們可以重寫
x C(n,x)=n C(n–1,x–1)。
這是真的,因?yàn)椋?/p>
x C(n,x)=x n!/(x?。╪數(shù)學(xué)常識(shí)-x)!)=n!/((x-1)!(n-x)?。?n(n-1)!/((x-1)?。ǎ╪-1)-(x-1))!)=n C(n–1,x–1)。
由此可見:
E[X]=∑nn C(n–1,X–1)pX(1–p)n–X。
我們從上面的表達(dá)式中剔除了n和一個(gè)p:
E[X]=n p∑nC(n–1,X–1)pX–1(1–p)(n–1)-(X–1)。
變量140 r x-1141的變化給了我們:
(n-1,r)p 149 r 150(1-p)151(n-1)-r 152>。
通過二項(xiàng)式,(x+y)k=∑kC(k,r)xryk–r可以重寫上面的總和:
E[X]=(n p)(p+(1–p))n–1=np。
上述論點(diǎn)讓我們走了很長(zhǎng)一段路。從二項(xiàng)分布的期望值和概率質(zhì)量函數(shù)的定義開始,我們已經(jīng)證明了我們的直覺告訴我們的。二項(xiàng)分布的期望值B(n,p)是n p。