計(jì)算平均值的置信區(qū)間

推論統(tǒng)計(jì)涉及從統(tǒng)計(jì)樣本開始然后達(dá)到未知的總體參數(shù)值的過程。未知值不是直接確定的。相反,我們最終得出的估計(jì)值屬于一系列值。該范圍在數(shù)學(xué)術(shù)語中是實(shí)數(shù)的間隔,并且特別稱為置信區(qū)間。

置信區(qū)間在幾個方面都是相似的。雙面置信區(qū)間都有相同的形式:

估計(jì)±誤差范圍

置信區(qū)間的相似性也擴(kuò)展到用于計(jì)算置信區(qū)間的步驟。當(dāng)人口標(biāo)準(zhǔn)偏差未知時,我們將研究如何確定人口平均數(shù)的雙側(cè)置信區(qū)間。一個基本的假設(shè)是我們是從正態(tài)分布的人口中抽樣的。

具有未知Sigma

的均值的置信區(qū)間過程

我們將通過查找所需置信區(qū)間所需的步驟列表。盡管所有步驟都很重要,但第一步尤其如此:

  1. 檢查條件:首先確保滿足我們置信區(qū)間的條件。我們假設(shè)用希臘字母sigmaσ表示的總體標(biāo)準(zhǔn)差的值是未知的,并且我們正態(tài)分布。只要我們的樣本足夠大并且沒有異常值或極端偏度,我們可以放寬假設(shè),即我們具有正態(tài)分布。
  2. 計(jì)算估計(jì)值:我們估計(jì)我們的人口參數(shù),在這種情況下,通過使用統(tǒng)計(jì)量,總體平均值在這種情況下是樣本平均值。這涉及從我們的人口中形成一個簡單的隨機(jī)樣本。有時我們可以假設(shè)我們的樣本是一個簡單的隨機(jī)樣本,即使它不符合嚴(yán)格的定義。
  3. 臨界值:我們獲得與我們的置信度相對應(yīng)的臨界值t*。通過查閱t分?jǐn)?shù)表或使用軟件可以找到這些值。如果我們使用表格,我們需要知道自由度的數(shù)量。自由度數(shù)比我們樣本中的個體數(shù)少一個。
  4. 誤差幅度:計(jì)算誤差幅度t*s/√n,其中n是我們形成的簡單隨機(jī)樣本的大小,s是樣本標(biāo)準(zhǔn)偏差,
  5. 結(jié)論:通過匯總估計(jì)值和誤差范圍來完成。這可以表示為估計(jì)±誤差幅度女性生理健康常識估計(jì)-誤差幅度估計(jì)+誤差幅度。在我們置信區(qū)間的陳述中,重要的是要指出置信水平。這只是我們置信區(qū)間的一部分,與估計(jì)值和誤差范圍的數(shù)字一樣。

示例

為了了解我們?nèi)绾螛?gòu)建置信區(qū)間,我們將通過一個例子來解決。假設(shè)我們知道特定種類豌豆植物的高度是正態(tài)分布的。30個豌豆植物的簡單隨機(jī)樣本的平均高度為12英寸,樣本標(biāo)準(zhǔn)偏差為2英寸。整個豌豆植物種群的平均高度的90%置信區(qū)間是多少?

我們將完成上述步驟:

  1. 檢查條件:由于人口標(biāo)準(zhǔn)偏差未知,我們正在處理正態(tài)分布,因此滿足了條件。
  2. 計(jì)算估計(jì)值:我們已經(jīng)被告知我們有30個豌豆植物的簡單隨機(jī)樣本。此樣本的平均高度為12英寸,因此這是我們的估計(jì)值。
  3. 臨界值:我們的樣本尺寸為30,因此有29個自由度。置信水平為90%的臨界值由t*=1.699給出。
  4. 誤差范圍:現(xiàn)在我們使用誤差范圍公式并獲得t*s/√n=(1.699)(2)/√(30)=0.620。
  5. 結(jié)論:我們把所有事情放在一起一起。人口平均身高得分的90%置信區(qū)間為12±0.62英寸。或者,我們可以將此置信區(qū)間聲明為11.38英寸至12.62英寸。

實(shí)際考慮

上述類型的置信區(qū)間比統(tǒng)計(jì)課程中可能遇到的其他類型更現(xiàn)實(shí)。知道人口標(biāo)準(zhǔn)差但不知道人口平均數(shù)是非常罕見的。在這里,我們假設(shè)我們不知道這兩個總體參數(shù)。