什么是分類變量的雙向表?

統(tǒng)計的目標之一是以有意義的方式排列數(shù)據(jù)。雙向表是組織特定類型配對數(shù)據(jù)的重要方式。與統(tǒng)計中任何圖表或表格的構(gòu)建一樣,了解非常重要我們正在處理的變量類型。如果我們有定量數(shù)據(jù),則應使用直方圖或莖葉圖等圖形。如果我們有分類數(shù)據(jù),那么條形圖或餅圖是合適的。

使用配對數(shù)據(jù)時,我們必須小心。配對定量數(shù)據(jù)存在散點圖,但配對分類數(shù)據(jù)有什么樣的圖?每當我們有兩個分類變量時,我們應該使用一個雙向表。

雙向表的描述

首先,我們回想起分類數(shù)據(jù)與特征或類別有關。它不是定量的,也沒有數(shù)值。

雙向表涉及列出兩個分類變量的所有值或級別。其中一個變量的所有值都列在垂直列中。其他變量的值沿水平行列出。如果第一個變量具有m值而第二個變量具有n值,則表中總共有mn個條目。這些條目中的每一個對應于兩個變量中的每一個的特定值。

沿著每一行和每一列,條目是總計的。這些總數(shù)在確定邊際分布和條件分布時很重要。當我們進行卡方檢驗獨立性時,這些總數(shù)也很重要。

雙向表的示例

例如,我們將考慮一種情況,在這種情況下,我們將查看大學統(tǒng)計課程的幾個部分。我們想要構(gòu)建一個雙向表格來確定課程中男性和女性之間存在哪些差異(如果有的話)。到為此,我們計算每個性別成員獲得的每個字母等級的數(shù)量。

教育資源網(wǎng)_1

我們注意到,第一個分類變量是性別變量,在男性和女性的研究中有兩個可能的值。第二個分類變量是字母等級的變量,A,B,C,D和F給出了五個值。這意味著我們將有一個雙向表,其中有2 x 5=10個條目,加上一個額外的行和一個額外的列,將需要列出行和列總數(shù)。

我們的調(diào)查顯示:

  • 50名男性獲得A,60名女性獲得A.
  • 60名男性獲得B,80名女性獲得B.
  • 100名男性獲得C,50名女性獲得C.
  • 40名男性獲得D,50名女性獲得D.
  • 30名男性獲得F,20名女性獲得F.

此信息輸入下面的雙向表格。每行的總數(shù)告訴我們每種等級的收入是多少。列總數(shù)告訴我們男性人數(shù)和女性人數(shù)。

雙向表的重要性

當我們有兩個分類變量時,雙向表有助于組織我們的數(shù)據(jù)。該表可用于幫助我們比較數(shù)據(jù)中的兩個不同組。例如,我們可以考慮統(tǒng)計課程中男性的相對表現(xiàn)與課程中女性的表現(xiàn)。

下一步

在形成雙向表格后,下一步可能是統(tǒng)計分析數(shù)據(jù)。我們可能會問研究中的變量是否相互獨立。為了回答這個問題,我們可以使用卡方檢驗在雙向表格上。

年級和性別雙向表

114 A 115120 110 121134 C 135140 150 141144 D 145150 90 151154 F 155
Male總計
5060
B6080140
10050
4050
302050
總計280260540

科普小知識大全