計算相關(guān)系數(shù)
查看散點(diǎn)圖時需要問很多問題。最常見的一種是想知道直線接近數(shù)據(jù)的程度。為了幫助回答這個問題,有一個稱為相關(guān)系數(shù)的描述性統(tǒng)計量。我們將看到如何計算此統(tǒng)計信息。
The Correlation Coefficient
用r表示的相關(guān)系數(shù)告訴我們散點(diǎn)圖中的數(shù)據(jù)沿直線下降的緊密程度。r的**值越接近1,線性方程描述的數(shù)據(jù)越好。如果r=1或r=-1,則數(shù)據(jù)集完全對齊。值r接近零的數(shù)據(jù)集幾乎沒有直線關(guān)系。
由于計算時間長,**使用計算器或統(tǒng)計軟件計算r。但是,知道計算器在計算時正在做什么總是值得的。下面是一個主要用手工計算相關(guān)系數(shù)的過程,計算器用于常規(guī)算術(shù)步驟。
計算r
的步驟我們將首先列出計算相關(guān)系數(shù)的步驟。我們使用的數(shù)據(jù)是配對數(shù)據(jù),每對數(shù)據(jù)將用(x,y)表示健康知識我知道手抄報。
- 我們從一些初步計算開始。這些計算的數(shù)量將用于我們計算r:
- 計算x?,數(shù)據(jù)的所有第一坐標(biāo)的平均值x。
- 計算?,數(shù)據(jù)的所有第二坐標(biāo)的平均值
- y。
- 計算s所有樣本的標(biāo)準(zhǔn)差數(shù)據(jù)的第一個坐標(biāo)中的一個x。
- 計算s數(shù)據(jù)的所有第二個坐標(biāo)的樣本標(biāo)準(zhǔn)偏差y。
- Use公式(z)=(x–x?)/s并計算每個x的標(biāo)準(zhǔn)化值。
- 使用公式(z)=(y–?)/s并計算每個y標(biāo)準(zhǔn)化值。
- 乘以相應(yīng)的標(biāo)準(zhǔn)值:(z)(z)
- 添加**一步的產(chǎn)品
- 將上一步的總和除以n–1,其中n是我們配對數(shù)據(jù)集中的點(diǎn)總數(shù)。所有這些的結(jié)果是相關(guān)系數(shù)r。
這個過程并不難,每一步都是相當(dāng)常規(guī)的,但所有這些步驟的收集都非常復(fù)雜。標(biāo)準(zhǔn)偏差的計算本身就足夠繁瑣。但是相關(guān)系數(shù)的計算不僅涉及兩個標(biāo)準(zhǔn)偏差,還涉及許多其他操作。
示例
為了確切地看到如何獲得r的值,我們看一個例子。同樣,重要的是要注意,對于實(shí)際應(yīng)用,我們希望使用計算器或統(tǒng)計軟件為我們計算r。
我們首先列出配對數(shù)據(jù):(1,1),(2,3),(4,5),(5,7)。x值的平均值,1,2,4和5的平均值是x?=3。我們也有?=4。標(biāo)準(zhǔn)差
x值為s=1.83和s=2.58。下表總結(jié)了r所需的其他計算。最右邊欄中的產(chǎn)品總和為2.969848。由于總共有四個點(diǎn),4-1=3,我們將產(chǎn)品總和除以3。這給我們一個相關(guān)系數(shù)r=2.969848/3=0.989949。
表相關(guān)系數(shù)計算示例
x | y | z | z | zz |
---|---|---|---|---|
-1.09544503 | -1.161894958 | 1.272792057 | ||
3 | -0.547722515 | -0.387298319 | 0.212132009 | |
4 | 5 | 0.547722515 | 0.387298319 | 0.212132009 |
5 | 7 | 1.09544503 | 1.161894958 | 1.272792057 |