相對(duì)頻率直方圖

在統(tǒng)計(jì)中,有許多術(shù)語(yǔ)之間有細(xì)微的區(qū)別。其中一個(gè)例子是頻率和相對(duì)頻率之間的差異。盡管相對(duì)頻率有許多用途,但特別有一種涉及相對(duì)頻率直方圖。這是一種與統(tǒng)計(jì)和數(shù)學(xué)統(tǒng)計(jì)中的其他主題相關(guān)的圖形。

Definition

直方圖是看起來(lái)像條形圖的統(tǒng)計(jì)圖。但是,通常,術(shù)語(yǔ)直方圖保留用于定量變量。直方圖的橫軸是包含均勻長(zhǎng)度的類或倉(cāng)的數(shù)字線。這些分箱是數(shù)據(jù)可以下降的數(shù)字線的間隔,并且可以由單個(gè)數(shù)字(通常對(duì)于相對(duì)較小的離散數(shù)據(jù)集)或一系列值(對(duì)于較大的離散數(shù)據(jù)集和連續(xù)數(shù)據(jù))組成。

例如,我們可能有興趣考慮一類學(xué)生在50分測(cè)驗(yàn)中的分?jǐn)?shù)分布。構(gòu)建垃圾箱的一種可能方法是每10點(diǎn)有一個(gè)不同的垃圾箱。

直方圖的縱軸表示數(shù)據(jù)值出現(xiàn)在每個(gè)分箱中的計(jì)數(shù)或頻率。條形越高,進(jìn)入該bin值范圍的數(shù)據(jù)值越多。為了回到我們的例子,如果我們有五名學(xué)生在測(cè)驗(yàn)中得分超過(guò)40分,那么對(duì)應(yīng)于40到50分的欄將是五個(gè)單位高。

頻率直方圖比較

相對(duì)頻率直方圖是典型頻率直方圖的微小修改。我們使用這個(gè)軸來(lái)表示落入這個(gè)bin的數(shù)據(jù)值的總體比例,而不是使用垂直軸來(lái)計(jì)算落入給定bin的數(shù)據(jù)值的數(shù)量。由于****=1,所有條的高度必須從0到1。此外,所有條的高度在我們的相對(duì)頻率hIsogram必須總和為1。

因此,在我們一直在看的運(yùn)行示例中,假設(shè)我們班上有25名學(xué)生,5名學(xué)生得分超過(guò)40分。我們不會(huì)為這個(gè)bin構(gòu)造一個(gè)高度為5的條,而是要有一個(gè)高度為5/25=0.2的條。

將直方圖與相對(duì)頻率直方圖進(jìn)行比較,每個(gè)直方圖都有相同的箱,我們會(huì)注意到一些事情。直方圖的整體形狀將是相同的。相對(duì)頻率直方圖不強(qiáng)調(diào)每個(gè)箱中的總計(jì)數(shù)。相反,這種類型的圖形側(cè)重于箱中數(shù)據(jù)值的數(shù)量如何與其他箱相關(guān)。它顯示這種關(guān)系的方式是通過(guò)總數(shù)的百分比數(shù)據(jù)值的數(shù)量。

概率質(zhì)量函數(shù)

我們可能想知道定義相對(duì)頻率直方圖的要點(diǎn)。一個(gè)關(guān)鍵應(yīng)用涉及離散隨機(jī)變量,其中我們的分箱寬度為1,并以每個(gè)非負(fù)整數(shù)為中心。在這種情況下,我們可以定義一個(gè)分段函數(shù),其值對(duì)應(yīng)于相對(duì)頻率直方圖中條形的垂直高度。

這種類型的函數(shù)稱為概率質(zhì)量函數(shù)。以這種方式構(gòu)造函數(shù)的原因是由函數(shù)定義的曲線與概率有直接聯(lián)系。從值ab的曲線下面積是隨機(jī)變量具有從ab的值的概率。

概率和曲線下面積之間的聯(lián)系是在數(shù)學(xué)統(tǒng)計(jì)中重復(fù)出現(xiàn)的聯(lián)系。使用概率質(zhì)量函數(shù)對(duì)相對(duì)頻率直方圖進(jìn)行建模是另一種這樣的連接。

視力小知識(shí)