統(tǒng)計的穩(wěn)健性
在統(tǒng)計學(xué)中,術(shù)語魯棒性或魯棒性是指根據(jù)研究希望實現(xiàn)的統(tǒng)計分析的特定條件,統(tǒng)計模型,測試和程序的強度。鑒于滿足這些研究條件,可以通過使用數(shù)學(xué)證明來驗證模型是正確的。
許多模型基于處理真實世界數(shù)據(jù)時不存在的理想情況,因此,即使條件不完全滿足,模型也可以提供正確的結(jié)果。
因此,魯棒統(tǒng)計數(shù)據(jù)是從廣泛的概率分布中提取數(shù)據(jù)時產(chǎn)生良好性能的任何統(tǒng)計數(shù)據(jù),這些概率分布在很大程度上不受異常值或與給定數(shù)據(jù)集中模型假設(shè)的微小偏差的影響。換句話說,強大的統(tǒng)計數(shù)據(jù)可以抵抗結(jié)果中的錯誤。
一種觀察常用穩(wěn)健統(tǒng)計程序的方法,只需要看看t程序,它使用假設(shè)檢驗來確定最準(zhǔn)確的統(tǒng)計預(yù)測。
觀察T程序
對于魯棒性的一個例子,我們將考慮t-過程,其中包括具有未知群體標(biāo)準(zhǔn)偏差的群體平均值的置信區(qū)間以及關(guān)于群體平均值的假設(shè)檢驗。
t-過程的使用假定如下:
- 我們正在使用的數(shù)據(jù)集是人口的簡單隨機樣本。
- 我們從中抽樣的乳房健康小知識人口是正態(tài)分布的。
在現(xiàn)實生活中的例子中,統(tǒng)計學(xué)家很少有正態(tài)分布的人口,所以問題變成了“我們的t-程序有多強大?”
一般來說,我們有一個簡單的隨機樣本的條件比我們從nor采樣的條件更重要總體分布;其原因是中心極限定理確保了近似正態(tài)的抽樣分布-樣本量越大,樣本均值的抽樣分布越接近正態(tài)。
T過程如何充當(dāng)魯棒統(tǒng)計量
因此,t-程序的魯棒性取決于樣本量和樣本分布。對此的考慮包括:
- 如果樣本量很大,這意味著我們有40個或更多的觀測值,那么即使分布偏斜,也可以使用t-程序。
- 如果樣本量在15到40之間,那么我們可以對任何形狀分布使用t-程序,除非存在異常值或高度偏斜。
- 如果樣本大小小于15,那么對于沒有異常值,單個峰值且?guī)缀鯇ΨQ的數(shù)據(jù),我們可以使用t-過程。
在大多數(shù)情況下,通過數(shù)學(xué)統(tǒng)計學(xué)的技術(shù)工作已經(jīng)建立了穩(wěn)健性,幸運的是,我們不一定需要做這些先進(jìn)的數(shù)學(xué)計算才能正確利用它們;我們只需要了解整體準(zhǔn)則對于穩(wěn)健性我們的具體統(tǒng)計方法。
T程序起到穩(wěn)健統(tǒng)計的作用,因為它們通常通過將樣本大小考慮為應(yīng)用程序的基礎(chǔ)來為這些模型產(chǎn)生良好的性能。