幼兒健康知識大全_什么是內(nèi)圍欄和外圍欄?
數(shù)據(jù)集的一個重要特征是確定它是否包含任何異常值。幼兒健康知識大全在我們的數(shù)據(jù)集中,異常值直觀地被認(rèn)為是與大多數(shù)其他數(shù)據(jù)有很大不同的值。當(dāng)然,這種對異常值的理解是模棱兩可的。要被視為異常值,該值應(yīng)該偏離其余數(shù)據(jù)多少?一個研究人員稱之為異常值會與另一個匹配嗎?為了提供一些一致性和定量測量異常值的確定,我們使用內(nèi)外圍欄。
為了找到一組數(shù)據(jù)的內(nèi)部和外部圍欄,我們首先需要一些其他描述性統(tǒng)計數(shù)據(jù)。我們將首先計算四分位數(shù)。這將導(dǎo)致四分位間距。**,通過我們的這些計算,我們將能夠確定內(nèi)部和外部的圍欄。
Quartiles
第一和第三四分位數(shù)幼兒健康知識大全是任何一組定量數(shù)據(jù)的五個數(shù)字摘要的一部分。我們首先在所有值按升序列出后找到數(shù)據(jù)的中位數(shù)或中點(diǎn)。小于中值的值對應(yīng)于大約一半的數(shù)據(jù)。我們找到這一半數(shù)據(jù)集的中位數(shù),這是第一個四分位數(shù)。
以類似的方式,我們現(xiàn)在考慮數(shù)據(jù)集的上半部分。如果我們找到這一半數(shù)據(jù)的中位數(shù),那么我們有第三四分位數(shù)。這些四分位數(shù)的名字來源于他們將數(shù)據(jù)集分成四個相等大小的部分或四分之一。換句話說,大約25%的數(shù)據(jù)值小于第一個四分位數(shù)。以類似的方式,大約75%的數(shù)據(jù)值小于第三四分位數(shù)。
Interquartile Range
我們接下來需要找到四分位間距(IQR)。這比第一個四分位數(shù)q和第三個四分位數(shù)q更容易計算。我們需要做的就是采取行動e這兩個四分位數(shù)的差異。這給了我們公式:
IQR=Q-Q
IQR告訴我們數(shù)據(jù)集的中間部分是如何分布的。
找到內(nèi)部圍欄
我們現(xiàn)在可以找到內(nèi)部的圍欄。我們從IQR開始,將這個數(shù)字乘以1.5。然后,我們從第一個四分位數(shù)中減去這個數(shù)字。我們還將此數(shù)字添加到第三個四分位數(shù)。這兩個數(shù)字構(gòu)成了我們的內(nèi)圍欄。
找到外圍欄55 56對于外部圍欄,我們從IQR開始,將這個數(shù)字乘以3。然后,我們從第一個四分位數(shù)中減去這個數(shù)字,并將其加到第三個四分位數(shù)。這兩個數(shù)字是我們的外部圍欄。
檢測異常值
現(xiàn)在,異常值的檢測變得與確定數(shù)據(jù)值參考我們的內(nèi)部和外部圍欄的位置一樣容易。如果單個數(shù)據(jù)值比我們的任何一個外部圍欄都更極端,那么這是一個異常值,有時被稱為強(qiáng)異常值。如果我們的數(shù)據(jù)值位于相應(yīng)的內(nèi)部和外部圍欄之間,則該值為可疑異常值或輕度異常值。我們將通過下面的示例看到它是如何工作的。
示例
假設(shè)我們已經(jīng)計算了數(shù)據(jù)的第一和第三四分位數(shù),并分別找到了50和60的這些值。四分位間距IQR=60–50=10。接下來,我們看到1.5 x IQR=15。這意味著內(nèi)部圍欄分別為50-15=35和60+15=75。這比第一個四分位數(shù)少1.5倍IQR,比第三個四分位數(shù)多。
我們現(xiàn)在計算3 x IQR,看到這是3 x 10=30。外圍欄比第一和第三四分位數(shù)更極端3倍IQR。這意味著外圍欄是50-30=20和60+30=90。
任何小于20或大于90的數(shù)據(jù)值都被考慮在內(nèi)列斯。任何29到35或75到90之間的數(shù)據(jù)值都被懷疑是異常值。