了解統(tǒng)計(jì)
我們每人早餐吃多少卡路里?大家今天旅行有多遠(yuǎn)?我們打電話回家的地方有多大?還有多少人把它叫回家?為了理解所有這些信息,某些工具和思維方式是必要的。稱(chēng)為統(tǒng)計(jì)的數(shù)學(xué)科學(xué)有助于我們處理這種信息超載。
統(tǒng)計(jì)是對(duì)數(shù)字信息的研究,稱(chēng)為數(shù)據(jù)。統(tǒng)計(jì)人員獲取,組織和分析數(shù)據(jù)。這個(gè)過(guò)程的每個(gè)部分也都經(jīng)過(guò)仔細(xì)檢查。統(tǒng)計(jì)技術(shù)應(yīng)用于許多其他知識(shí)領(lǐng)域。以下是整個(gè)統(tǒng)計(jì)數(shù)據(jù)中一些主要主題的介紹。
人口和樣本
統(tǒng)計(jì)數(shù)據(jù)中反復(fù)出現(xiàn)的主題之一是,我們能夠根據(jù)對(duì)該群體中相對(duì)較小部分的研究來(lái)說(shuō)出有關(guān)大型群體的內(nèi)容。整個(gè)群體被稱(chēng)為人口。我們研究的部分是樣本。
作為一個(gè)例子,假設(shè)我們想知道生活在美國(guó)的人的平均身高。我們可以嘗試衡量超過(guò)3億人,但這是不可行的。這將是一個(gè)后勤噩夢(mèng),以這樣的方式進(jìn)行測(cè)量,沒(méi)有人錯(cuò)過(guò),沒(méi)有人計(jì)算兩次。
由于衡量美國(guó)每個(gè)人的不可能性質(zhì),我們可以改為使用統(tǒng)計(jì)數(shù)據(jù)。我們不是找到人口中每個(gè)人的身高,而是采取幾千的統(tǒng)計(jì)樣本。如果我們正確地對(duì)人口進(jìn)行了抽樣,那么樣本的平均高度將非常接近人口的平均高度。
獲取數(shù)據(jù)
為了得出好的結(jié)論,我們需要良好的數(shù)據(jù)來(lái)處理。我們應(yīng)該始終仔細(xì)檢查我們抽樣人口以獲得這些數(shù)據(jù)的方式。我們使用哪種樣本取決于我們的問(wèn)題重新詢問(wèn)人口。最常用的樣本是:
- 簡(jiǎn)單隨機(jī)
- 分層
- 聚類(lèi)
了解如何進(jìn)行樣品測(cè)量同樣重要。要回到上面的例子,我們?nèi)绾潍@取樣本中的高度?
- 我們是否讓人們?cè)趩?wèn)卷上報(bào)告自己的身高?
- 全國(guó)有幾位研究人員會(huì)測(cè)量不同的人并報(bào)告他們的結(jié)果嗎?
- 一位研究人員是否使用相同的卷尺測(cè)量樣本中的每個(gè)人?
這些獲取數(shù)據(jù)的方法中的每一種都有其優(yōu)點(diǎn)和缺點(diǎn)。任何使用本研究數(shù)據(jù)的人都想知道它是如何獲得的。
組織數(shù)據(jù)
有時(shí)有大量數(shù)據(jù),我們可以從字面上丟失所有細(xì)節(jié)。很難看到樹(shù)木的森林。這就是為什么保持我們的數(shù)據(jù)組織良好很重要。數(shù)據(jù)的精心組織和圖形顯示有助于我們?cè)趯?shí)際進(jìn)行任何計(jì)算之前發(fā)現(xiàn)模式和趨勢(shì)。
由于我們以圖形方式呈現(xiàn)數(shù)據(jù)的方式取決于多種因素。常見(jiàn)圖表是:
- 餅圖或圓圖
- 條形圖或帕累托圖
- 散點(diǎn)圖
- 時(shí)間圖
- 莖葉圖
- 盒須圖
除了這些眾所周知的圖表之外,還有其他一些用于特殊情況。
描述性統(tǒng)計(jì)
分析數(shù)據(jù)的一種方法稱(chēng)為描述性統(tǒng)計(jì)。這里的目標(biāo)是計(jì)算描述我們數(shù)據(jù)的數(shù)量。稱(chēng)為平均值,中位數(shù)和模式的數(shù)字都用于表示數(shù)據(jù)的平均值或中心值。范圍和標(biāo)準(zhǔn)偏差用于說(shuō)明數(shù)據(jù)的擴(kuò)展方式。更復(fù)雜的技術(shù),例如correlation和回歸描述配對(duì)的數(shù)據(jù)。
推論統(tǒng)計(jì)
當(dāng)我們從一個(gè)樣本開(kāi)始,然后嘗試推斷一些關(guān)于人口的東西,我們正在使用推理統(tǒng)計(jì)。在處理這一統(tǒng)計(jì)領(lǐng)域時(shí),出現(xiàn)了假設(shè)檢驗(yàn)的主題。在這里,我們看到統(tǒng)計(jì)主題的科學(xué)性質(zhì),當(dāng)我們陳述假設(shè)時(shí),然后使用統(tǒng)計(jì)工具和我們的樣本來(lái)確定我們是否需要拒絕假設(shè)的可能性。這種解釋實(shí)際上只是在刮擦這個(gè)非常有用的統(tǒng)計(jì)部分的表面。
統(tǒng)計(jì)應(yīng)用
毫不夸張地說(shuō),統(tǒng)計(jì)工具幾乎被每個(gè)科學(xué)研究領(lǐng)域所使用。以下是一些嚴(yán)重依賴統(tǒng)計(jì)數(shù)據(jù)的領(lǐng)域:
- 心理學(xué)
- 經(jīng)濟(jì)學(xué)
- 醫(yī)學(xué)
- 廣告
- 人口統(tǒng)計(jì)學(xué)
統(tǒng)計(jì)基礎(chǔ)
雖然有些人認(rèn)為統(tǒng)計(jì)學(xué)是數(shù)學(xué)的一個(gè)分支,但**把它看作是一門(mén)建立在數(shù)學(xué)基礎(chǔ)上的學(xué)科。具體而言,統(tǒng)計(jì)數(shù)據(jù)是從數(shù)學(xué)領(lǐng)域建立起來(lái)的,稱(chēng)為概率。概率為我們提供了一種確定事件發(fā)生的可能性的方法。它也為我們提供了一種談?wù)撾S機(jī)性的方式。這是統(tǒng)計(jì)的關(guān)鍵,因?yàn)樾枰獜娜后w中隨機(jī)選擇典型樣本。
概率首先在1700年代由數(shù)學(xué)家如Pascal和Fermat研究。1700年代也標(biāo)志著統(tǒng)計(jì)的開(kāi)始。統(tǒng)計(jì)數(shù)據(jù)從其概率根源不斷增長(zhǎng),并在19世紀(jì)真正起飛。今天,它的理論范圍在數(shù)學(xué)統(tǒng)計(jì)中不斷擴(kuò)大。
冬季養(yǎng)生小常識(shí)