什么是殘差?

線性回歸是一種統(tǒng)計(jì)工具,用于確定直線擬合一組配對(duì)數(shù)據(jù)的程度。最適合該數(shù)據(jù)的直線稱為最小二乘回歸線。該線可以多種方式使用。其中一個(gè)用途是估計(jì)解釋變量給定值的響應(yīng)變量的值。與這個(gè)想法有關(guān)的是剩余的。

通過(guò)執(zhí)行減法獲得殘差。我們必須做的就是從特定xy的觀測(cè)值中減去y的預(yù)測(cè)值。結(jié)果稱為殘差。

16殘差公式17 18

殘差公式很簡(jiǎn)單:

剩余觀測(cè)值24 y 25-預(yù)測(cè)值26 y 27

重要的是要注意,預(yù)測(cè)值來(lái)自我們的回歸線。觀察值來(lái)自我們的數(shù)據(jù)集。

示例

我們將通過(guò)使用一個(gè)例子來(lái)說(shuō)明這個(gè)公式的使用。假設(shè)我們得到了以下一組配對(duì)數(shù)據(jù):

(1,2),(2,3),(3,7),(3,6),(4,9),(5,9)

通過(guò)使用軟件,我們可以看到最小二乘回歸線是y=2x。我們將使用它來(lái)預(yù)測(cè)x的每個(gè)值的值。

例如,當(dāng)x=5時(shí),我們看到2(5)=10。這給了我們沿著回歸線的點(diǎn),x坐標(biāo)為5。

為了計(jì)算x=5點(diǎn)處的殘差,我們從觀測(cè)值中減去預(yù)測(cè)值。由于我們數(shù)據(jù)點(diǎn)的y坐標(biāo)為9,因此殘差為9–10=-1。

在下表中,我們將看到如何計(jì)算此數(shù)據(jù)集的所有殘差:

教育_1

92>觀察y94>Predicted y 95>112 3 113136 0 137
X剩余
1220
24-1
3761
366
4981
5910-1

殘差特征

現(xiàn)在我們已經(jīng)看到了一個(gè)示例,需要注意殘差的一些特征:

  • 殘差對(duì)于落在回歸線以上的點(diǎn)是正的。
  • 對(duì)于落在回歸線以下的點(diǎn),殘差是負(fù)的。
  • 對(duì)于完全沿著回歸線落下的點(diǎn),殘差為零。
  • 殘差的**值越大,點(diǎn)越遠(yuǎn)離回歸行。
  • 所有殘差的總和應(yīng)為零。實(shí)際上,這個(gè)總和有時(shí)并不完全為零。造成這種差異的原因是折衷錯(cuò)誤可能會(huì)累積。

殘差的使用

殘差有幾種用途。一個(gè)用途是幫助我們確定我們是否有一個(gè)具有整體線性趨勢(shì)的數(shù)據(jù)集,或者我們是否應(yīng)該考慮不同的模型。其原因是殘差有助于放大我們數(shù)據(jù)中的大班健康知識(shí)任何非線性模式。通過(guò)查看散點(diǎn)圖可能難以看到的內(nèi)容可以通過(guò)檢查殘差和相應(yīng)的殘差圖更容易地觀察到。

考慮殘差的另一個(gè)原因是檢查是否滿足線性回歸推斷的條件。在驗(yàn)證線性趨勢(shì)(通過(guò)檢查殘差)之后,我們還檢查殘差的分布。為了能夠執(zhí)行回歸推斷,我們希望關(guān)于回歸線的殘差近似正態(tài)分布。直方圖或stemplot殘差將有助于驗(yàn)證是否滿足此條件。