Python統(tǒng)計(jì)學(xué)一數(shù)據(jù)的概括性度量詳解
一、數(shù)據(jù)的概括性度量
1、統(tǒng)計(jì)學(xué)概括:
統(tǒng)計(jì)學(xué)是應(yīng)用數(shù)學(xué)的一個(gè)分支,主要通過(guò)利用概率論建立數(shù)學(xué)模型,收集所觀察系統(tǒng)的數(shù)據(jù),進(jìn)行量化的分析、總結(jié),并進(jìn)而進(jìn)行推斷和預(yù)測(cè),為相關(guān)決策提供依據(jù)和參考。統(tǒng)計(jì)學(xué)主要又分為描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)學(xué)。給定一組數(shù)據(jù),統(tǒng)計(jì)學(xué)可以摘要并且描述這份數(shù)據(jù),這個(gè)用法稱作為描述統(tǒng)計(jì)學(xué)。另外,觀察者以數(shù)據(jù)的形態(tài)建立出一個(gè)用以解釋其隨機(jī)性和不確定性的數(shù)學(xué)模型,以之來(lái)推論研究中的步驟及母體,這種用法被稱做推論統(tǒng)計(jì)學(xué)。
2、數(shù)據(jù)的概括性度量:
1)集中趨勢(shì)的度量:
眾數(shù):眾數(shù)(Mode),是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù),有時(shí)眾數(shù)在一組數(shù)中有好幾個(gè)。用M表示。
中位數(shù):中位數(shù)(Median)是指將數(shù)據(jù)按大小順序排列起來(lái),形成一個(gè)數(shù)列,居于數(shù)列中間位置的那個(gè)數(shù)據(jù)。中位數(shù)用Me表示。計(jì)算公式:
四分位數(shù):四分位數(shù)(Quartile)把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)值就是四分位數(shù)。QL=下四分位數(shù),即第25百分位數(shù)( n / 4);QU=上四分位數(shù),即第75百分位數(shù)( 3n / 4)。
平均數(shù):算術(shù)平均數(shù)(arithmetic mean)算術(shù)平均數(shù)是指資料中各觀測(cè)值的總和除以觀測(cè)值個(gè)數(shù)所得的商,簡(jiǎn)稱平均數(shù)或均數(shù)。
2)離散趨勢(shì)的度量:
四分位差:四分位差(quartile deviation),也稱為內(nèi)距或四分間距(inter-quartile range),它是上四分位數(shù)(QU,即位于75%)與下四分位數(shù)(QL,即位于25%)的差。
極差:全距(Range),又稱極差,是用來(lái)表示統(tǒng)計(jì)資料中的變異量數(shù)(measures of variation),其最大值與最小值之間的差距
方差:方差(variance)(樣本方差)是各個(gè)數(shù)據(jù)分別與其平均數(shù)之差的平方的和的平均數(shù),通常以σ2表示,方差的計(jì)算公式為:
標(biāo)準(zhǔn)差:標(biāo)準(zhǔn)差 (Standard Deviation),也稱均方差(Mean square error), 。
離散系數(shù):離散系數(shù)又稱變異系數(shù),CV(Coefficient of Variance)表示。CV(Coefficient of Variance):標(biāo)準(zhǔn)差與均值的比值。離散系數(shù)越小,數(shù)據(jù)的離散程度就越小,反之,亦然。
3)偏度與峰度的度量:
偏態(tài)系數(shù):偏度(Skewness)亦稱偏態(tài)、偏態(tài)系數(shù),偏度是統(tǒng)計(jì)數(shù)據(jù)分布偏斜方向和程度的度量,是統(tǒng)計(jì)數(shù)據(jù)分布非對(duì)稱程度的數(shù)字特征。Sk>0時(shí),分布呈正偏態(tài)(右偏),Sk<0時(shí),分布呈負(fù)偏態(tài)(左偏)。
峰態(tài)系數(shù):(Kurtosis)峰度系數(shù)是用來(lái)反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標(biāo)。在正態(tài)分布情況下,峰度系數(shù)值是3。>3的峰度系數(shù)說(shuō)明觀察量更集中,有比正態(tài)分布更短的尾部;<3的峰度系數(shù)說(shuō)明觀測(cè)量不那么集中,有比正態(tài)分布更長(zhǎng)的尾部,類似于矩形的均勻分布。峰度系數(shù)的標(biāo)準(zhǔn)誤用來(lái)判斷分布的正態(tài)性。峰度系數(shù)與其標(biāo)準(zhǔn)誤的比值用來(lái)檢驗(yàn)正態(tài)性。如果該比值絕對(duì)值大于2,將拒絕正態(tài)性。
3、Python代碼實(shí)現(xiàn):
<span style='font-family:Microsoft YaHei;font-size:12px;'>#以下代碼基于Python3.5環(huán)境編寫import numpy as npimport stats as stsscores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23, 32, 34, 43, 41, 21, 23, 26, 26, 34, 42, 43, 25, 24, 23, 24, 44, 23, 14, 52,32, 42, 44, 35, 28, 17, 21, 32, 42, 12, 34]#集中趨勢(shì)的度量print(’求和:’,np.sum(scores))print(’個(gè)數(shù):’,len(scores))print(’平均值:’,np.mean(scores))print(’中位數(shù):’,np.median(scores))print(’眾數(shù):’,sts.mode(scores))print(’上四分位數(shù)’,sts.quantile(scores,p=0.25))print(’下四分位數(shù)’,sts.quantile(scores,p=0.75))#離散趨勢(shì)的度量print(’最大值:’,np.max(scores))print(’最小值:’,np.min(scores))print(’極差:’,np.max(scores)-np.min(scores))print(’四分位差’,sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25))print(’標(biāo)準(zhǔn)差:’,np.std(scores))print(’方差:’,np.var(scores))print(’離散系數(shù):’,np.std(scores)/np.mean(scores))#偏度與峰度的度量print(’偏度:’,sts.skewness(scores))print(’峰度:’,sts.kurtosis(scores))</span>
以上這篇Python統(tǒng)計(jì)學(xué)一數(shù)據(jù)的概括性度量詳解就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. 什么是Python變量作用域2. Android 實(shí)現(xiàn)徹底退出自己APP 并殺掉所有相關(guān)的進(jìn)程3. Vue實(shí)現(xiàn)仿iPhone懸浮球的示例代碼4. js select支持手動(dòng)輸入功能實(shí)現(xiàn)代碼5. Android studio 解決logcat無(wú)過(guò)濾工具欄的操作6. vue使用moment如何將時(shí)間戳轉(zhuǎn)為標(biāo)準(zhǔn)日期時(shí)間格式7. bootstrap select2 動(dòng)態(tài)從后臺(tái)Ajax動(dòng)態(tài)獲取數(shù)據(jù)的代碼8. 一個(gè) 2 年 Android 開發(fā)者的 18 條忠告9. PHP正則表達(dá)式函數(shù)preg_replace用法實(shí)例分析10. vue-drag-chart 拖動(dòng)/縮放圖表組件的實(shí)例代碼
