人口方差置信區(qū)間的例子

總體方差給出了如何展開數據集的指示。不幸的是,通常不可能確切地知道這個總體參數是什么。為了彌補我們缺乏知識,我們使用來自推理統(tǒng)計的主題,稱為置信區(qū)間。我們將看到一個如何計算總體方差置信區(qū)間的例子

置信區(qū)間公式

關于總體方差的(1-α)置信區(qū)間的公式。由以下一系列不平等給出:

[(n-1)s2]/B2n-1)s2]/A。

這里n是樣本大小,s2是樣本方差。數字A是具有n-1自由度的卡方分布點,其中曲線下面積的α/2恰好位于左側>A。以類似的方式,數字B是相同卡方分布的點,曲線下面積的α/2正好在B的右側。

預備

我們從具有10個值的數據集開始。這組數據值是通過簡單的隨機樣本獲得的:

97,7***4106120131,94,97,96102

需要一些探索性數據分析來表明沒有異常值。通過構建莖葉圖,我們可以看到這些數據可能來自近似正態(tài)分布的分布。這意味著我們可以繼續(xù)尋找總體方差的95%置信區(qū)間。

樣本方差

我們需要用樣本方差來估計總體方差,用s2表示。所以我們首先計算這個統(tǒng)計量。本質上,我們是平均偏離平均值的平方和。然而,相當于將該總和除以n我們將其除以n-1。

我們發(fā)現樣本均值是104.2。使用這個,我們得到的平均值的平方偏差之和由下式給出:

(97–104.2)2+(75–104.3)2+。+(96-104.2)96 2 97+(102-104.2)98 2 99 2495.6

我們將此總和除以10–1=9,以獲得277的樣本方差。生活常識百科寶典

卡方分布

我們現在轉向我們的卡方分布。由于我們有10個數據值,因此我們有9個自由度。由于我們需要中間95%的分布,因此兩個尾部中的每一個都需要2.5%。我們查閱卡方表或軟件,看到2.7004和19.023的表值包含了分布面積的95%。這些數字分別為AB。

我們現在擁有我們需要的一切,我們準備好組裝我們的置信區(qū)間。左端點的公式為[(n-1)s2]/B。這意味著我們的左端點是:

(9 x 277)/19.023=133

通過用A替換B可以找到正確的端點:

(9 x 277)/2.7004=923

因此,我們有95%的信心人口差異在133到923之間。

人口標準差

當然,由于標準偏差是方差的平方根,因此該方法可用于構建總體標準偏差的置信區(qū)間。我們需要做的就是采取端點的平方根。結果將是標準偏差的95%置信區(qū)間。

科普_1