內容導入:
大傢好,這裡是每天分析一點點。本期給大傢介紹的是數據分析基礎系列,主要給大傢介紹描述性統計分析原理,介紹偏度的基本原理,包括偏度概念、作用、計算方式、判斷標準、應用,再結合區域工資水平,探討偏度在實際數據分析中的應用。文章內容適合數據分析小白,內容深入淺出,案例貼合實際。下期給大傢介紹峰度系數,歡迎大傢關註。
概念介紹:
偏度的概念:
偏度是統計數據分佈偏斜方向和程度的度量,是統計數據分佈非對稱程度的數字特征,所謂非對稱就是指左右的不一致。偏度(Skewness)亦稱偏態、偏態系數。它是表征概率分佈密度曲線相對於平均值不對稱程度的特征數。直觀看來就是密度函數曲線尾部的相對長度(不理解沒關系,這是統計學定義)。
偏度的計算公式:
偏度計算為三階中心距除以三階標準差,所謂中心距,就是距離數據中心的距離,數據中心一般是值數據的平均值,因此中心距就是每個數減去平均數的和,然後求平均,三階就是在這個基礎上求三次方。三階標準差就是標準差的三次方,這樣理解這個公式就簡單瞭。
偏度的相關原理:
正態分佈的偏度為0,兩側尾部長度對稱。若以S表示偏度。
S<0稱分佈具有負偏離,也稱左偏態,此時數據位於均值左邊的比位於右邊的少,直觀表現為左邊的尾部相對於與右邊的尾部要長,因為有少數變量值很小,使曲線左側尾部拖得很長。
S>0稱分佈具有正偏離,也稱右偏態,此時數據位於均值右邊的比位於左邊的少,直觀表現為右邊的尾部相對於與左邊的尾部要長,因為有少數變量值很大,使曲線右側尾部拖得很長。
而S接近0則可認為分佈是對稱的。若知道分佈有可能在偏度上偏離正態分佈時,可用偏離來檢驗分佈的正態性。右偏時一般算術平均數>中位數>眾數,左偏時相反,即眾數>中位數>平均數。正態分佈三者相等。
偏度的特點:
偏度的特點:
如果一組數據是對稱的,則偏態系數 等於 0;
如果偏態系數大於1或者小於-1,稱為高度偏態分佈;
如果偏態系數在0.5~1 或-1~-0.5 之間,則認為是中等偏態分佈。
偏度的偏向:
偏度系數=0,則分佈對稱;
偏度系數>0,則頻數分佈的高峰向左偏移,長尾向右延伸,呈正偏態分佈;
偏度系數<0,則頻數分佈的高峰向右偏移,長尾向左延伸,呈負偏態分佈。
偏度的應用:
S>0,數據左偏,高峰向左偏移,長尾向右延伸,均值小於中位數與眾數,說明大數據多,大多數在平均值以上的水平,存在較小的離群值;
S<0,數據右偏,高峰向右偏移,長尾向左延伸,均值大於中位數與眾數,說明小數據多,大多數在平均值以下的水平,存在較大的離群值;
數據結論一般為,該地區收入存在極大值,貧富差距大;地區發展水平低,大多數人收入在平均值以下等等。
大傢,理論看著枯燥,我們準備瞭一個偏度介紹的小視頻,給大傢解解乏,幫助大傢進行理解,大傢如果感興趣的話,可以關註我們的微信公眾號進行觀看。
綜合應用場景:
接下來我們來看個實際的案例吧。
#數據偏度:某地區隨機50人的平均工資為
請分析該地區的收入水平與發展情況。
代碼計算過程
我們可以使用偏度來解釋收入水平等狀況,用python的計算過程如下。
import numpy as np
income=np.array([2589,2163,2126,3500,2268,1871,2050,1856,2572,1000,3932,2105,1652,2559,2741,1766,2705,2067,3800,2749,2020,6918,1350,1168,1245,1966,1080,915,1563,2307,2861,600,711,696,2261,3260,2219,2415,2877,2143,2564,172,951,1683,888,2880,4000,3500,1000,1250])
#求平均數 income_mean=np.mean(income)
#求中心距 center_dis=income-income_mean
#求標準差 sigma=np.std(income)
#求平均3階中心距 center_dis3=sum(np.power(center_dis,3))/len(income)
#求標準差的3次方 sigma3=np.power(sigma,3)
#求數據偏度 skewness=center_dis3/sigma3
print(skewness)#數據偏度為:1.424 偏度系數小於0,因此數據右偏
根據偏度的原理,S>0,數據左偏,高峰向左偏移,長尾向右延伸,均值小於中位數與眾數,說明大數據多,大多數在平均值以上的水平,存在較小的離群值;因此,我們可以得出結論,該地區篇幅差距較大,收入水平低的人居多,大多數人在平均收入以下,可以推測,該地區區域發展不均衡,並且發展水平較低,因為發展水平高的地區,大多數人應該在中等水平。
各位還沒有看懂的朋友,可以關註我們微信公眾號觀看視頻,那裡的解釋更加精彩。
本期分享到這裡,我們會在每周持續更新,咱們下期再見,期待您的光臨。
-
扫码下载安卓APP
-
微信扫一扫关注我们微信扫一扫打开小程序手Q扫一扫打开小程序
-
返回顶部