什么是殘差?
線性回歸是一種統(tǒng)計工具,用于確定直線擬合一組配對數(shù)據(jù)的程度。最適合該數(shù)據(jù)的直線稱為最小二乘回歸線。該線可以多種方式使用。其中一個用途是估計解釋變量給定值的響應(yīng)變量的值。與這個想法有關(guān)的是剩余的。
通過執(zhí)行減法獲得殘差。我們必須做的就是從特定x的y的觀測值中減去y的預(yù)測值。結(jié)果稱為殘差。
16殘差公式17 18
殘差公式很簡單:
剩余觀測值24 y 25-預(yù)測值26 y 27
重要的是要注意,預(yù)測值來自我們的回歸線。觀察值來自我們的數(shù)據(jù)集。
示例
我們將通過使用一個例子來說明這個公式的使用。假設(shè)我們得到了以下一組配對數(shù)據(jù):
(1,2),(2,3),(3,7),(3,6),(4,9),(5,9)
通過使用軟件,我們可以看到最小二乘回歸線是y=2x。我們將使用它來預(yù)測x的每個值的值。
例如,當x=5時,我們看到2(5)=10。這給了我們沿著回歸線的點,x坐標為5。
為了計算x=5點處的殘差,我們從觀測值中減去預(yù)測值。由于我們數(shù)據(jù)點的y坐標為9,因此殘差為9–10=-1。
在下表中,我們將看到如何計算此數(shù)據(jù)集的所有殘差:
X | 92>觀察y94>Predicted y 95>剩余 | ||
1 | 2 | 2 | 0 |
2 | 112 3 1134 | -1 | |
3 | 7 | 6 | 1 |
3 | 6 | 6 | 136 0 137|
4 | 9 | 8 | 1 |
5 | 9 | 10 | -1 |
殘差特征
現(xiàn)在我們已經(jīng)看到了一個示例,需要注意殘差的一些特征:
- 殘差對于落在回歸線以上的點是正的。
- 對于落在回歸線以下的點,殘差是負的。
- 對于完全沿著回歸線落下的點,殘差為零。
- 殘差的**值越大,點越遠離回歸行。
- 所有殘差的總和應(yīng)為零。實際上,這個總和有時并不完全為零。造成這種差異的原因是折衷錯誤可能會累積。
殘差的使用
殘差有幾種用途。一個用途是幫助我們確定我們是否有一個具有整體線性趨勢的數(shù)據(jù)集,或者我們是否應(yīng)該考慮不同的模型。其原因是殘差有助于放大我們數(shù)據(jù)中的大班健康知識任何非線性模式。通過查看散點圖可能難以看到的內(nèi)容可以通過檢查殘差和相應(yīng)的殘差圖更容易地觀察到。
考慮殘差的另一個原因是檢查是否滿足線性回歸推斷的條件。在驗證線性趨勢(通過檢查殘差)之后,我們還檢查殘差的分布。為了能夠執(zhí)行回歸推斷,我們希望關(guān)于回歸線的殘差近似正態(tài)分布。直方圖或stemplot殘差將有助于驗證是否滿足此條件。