統(tǒng)計(jì)中的概率分布
如果你花很多時(shí)間處理統(tǒng)計(jì)數(shù)據(jù),很快就會(huì)遇到“概率分布”這個(gè)短語(yǔ)。在這里,我們真正可以看到概率和統(tǒng)計(jì)數(shù)據(jù)的重疊區(qū)域有多少。雖然這聽起來(lái)像技術(shù)性的東西,但概率分布這個(gè)短語(yǔ)實(shí)際上只是一種談?wù)摻M織概率列表的方式。概率分布是將概率分配給隨機(jī)變量的每個(gè)值的函數(shù)或規(guī)則。在某些情況下可能會(huì)列出分布。在其他情況下,它以圖形形式呈現(xiàn)。
示例
假設(shè)我們滾動(dòng)兩個(gè)骰子,然后記錄骰子的總和??偤蛷?到12是可能的。每個(gè)總和都有特定的發(fā)生概率。我們可以簡(jiǎn)單地將這些列表如下:
- 總和2的概率為1/36
- 總和3的概率為2/36
- 總和4的概率為3/36
- 總和5的概率為4/36
- 總和6的概率為5/36
- 總和7的概率為6/36
- 總和8的概率為5/36
- 總和9的概率為概率為4/36
- 總和10的概率為3/36
- 總和11的概率為2/36
- 總和12的概率為1/36
該列表是滾動(dòng)雙骰子的概率實(shí)驗(yàn)的概率分布。我們還可以將上述視為通過(guò)查看兩個(gè)骰子的總和定義的隨機(jī)變量的概率分布。
Graph
可以繪制概率分布圖,有時(shí)這有助于向我們展示分布的特征,這些特征在閱讀概率列表時(shí)并不明顯。隨機(jī)變量沿x-軸繪制,相應(yīng)概率沿y-軸繪制。對(duì)于一個(gè)離散的隨機(jī)變量,我們將有一個(gè)直方圖。法羅群島r一個(gè)連續(xù)的隨機(jī)變量,我們將有一條平滑曲線的內(nèi)部。
概率規(guī)則仍然有效,它們以幾種方式表現(xiàn)出來(lái)。由于概率大于或等于零,概率分布圖必須具有非負(fù)的y坐標(biāo)。概率的另一個(gè)特征,即一個(gè)是事件概率可以**的特征,以另一種方式出現(xiàn)。
Area=Probability
概率分布圖的構(gòu)造方式使得區(qū)域表示概率。對(duì)于離散概率分布,我們實(shí)際上只是計(jì)算矩形的面積。在上圖中,對(duì)應(yīng)于四個(gè),五個(gè)和六個(gè)的三個(gè)條的區(qū)域?qū)?yīng)于我們骰子的總和為四個(gè),五個(gè)或六個(gè)的概率。所有酒吧的面積加起來(lái)總共一個(gè)。
在標(biāo)準(zhǔn)正態(tài)分布或鐘形曲線中,我們有類似的情況。兩個(gè)z值之間的曲線下面積對(duì)應(yīng)于我們的變量落在這兩個(gè)值之間的概率。例如,鐘形曲線下面積為-1 z。
重要分布
實(shí)際上有無(wú)限多的概率分布。一些更重要的分布列表如下:
- 84>85>二項(xiàng)式分布–給出一系列具有兩個(gè)結(jié)果的獨(dú)立實(shí)驗(yàn)的成功次數(shù)
- 卡方分布–用于確定觀測(cè)量與建議模型的接近程度
- F分布生活常識(shí)題–用于方差分析(ANOVA)
- 正態(tài)分布–稱為鐘形曲線,可在整個(gè)統(tǒng)計(jì)數(shù)據(jù)中找到。
- 學(xué)生的t分布–用于正態(tài)分布 的小樣本量