什么是殘差?

線性回歸是一種統(tǒng)計工具,用于確定直線擬合一組配對數(shù)據(jù)的程度。最適合該數(shù)據(jù)的直線稱為最小二乘回歸線。該線可以多種方式使用。其中一個用途是估計解釋變量給定值的響應(yīng)變量的值。與這個想法有關(guān)的是剩余的。

通過執(zhí)行減法獲得殘差。我們必須做的就是從特定xy的觀測值中減去y的預(yù)測值。結(jié)果稱為殘差。

16殘差公式17 18

殘差公式很簡單:

剩余觀測值24 y 25-預(yù)測值26 y 27

重要的是要注意,預(yù)測值來自我們的回歸線。觀察值來自我們的數(shù)據(jù)集。

示例

我們將通過使用一個例子來說明這個公式的使用。假設(shè)我們得到了以下一組配對數(shù)據(jù):

(1,2),(2,3),(3,7),(3,6),(4,9),(5,9)

通過使用軟件,我們可以看到最小二乘回歸線是y=2x。我們將使用它來預(yù)測x的每個值的值。

例如,當x=5時,我們看到2(5)=10。這給了我們沿著回歸線的點,x坐標為5。

為了計算x=5點處的殘差,我們從觀測值中減去預(yù)測值。由于我們數(shù)據(jù)點的y坐標為9,因此殘差為9–10=-1。

在下表中,我們將看到如何計算此數(shù)據(jù)集的所有殘差:

教育_1

92>觀察y94>Predicted y 95>112 3 113136 0 137
X剩余
1220
24-1
3761
366
4981
5910-1

殘差特征

現(xiàn)在我們已經(jīng)看到了一個示例,需要注意殘差的一些特征:

  • 殘差對于落在回歸線以上的點是正的。
  • 對于落在回歸線以下的點,殘差是負的。
  • 對于完全沿著回歸線落下的點,殘差為零。
  • 殘差的**值越大,點越遠離回歸行。
  • 所有殘差的總和應(yīng)為零。實際上,這個總和有時并不完全為零。造成這種差異的原因是折衷錯誤可能會累積。

殘差的使用

殘差有幾種用途。一個用途是幫助我們確定我們是否有一個具有整體線性趨勢的數(shù)據(jù)集,或者我們是否應(yīng)該考慮不同的模型。其原因是殘差有助于放大我們數(shù)據(jù)中的大班健康知識任何非線性模式。通過查看散點圖可能難以看到的內(nèi)容可以通過檢查殘差和相應(yīng)的殘差圖更容易地觀察到。

考慮殘差的另一個原因是檢查是否滿足線性回歸推斷的條件。在驗證線性趨勢(通過檢查殘差)之后,我們還檢查殘差的分布。為了能夠執(zhí)行回歸推斷,我們希望關(guān)于回歸線的殘差近似正態(tài)分布。直方圖或stemplot殘差將有助于驗證是否滿足此條件。