一、標準偏差

測量一個基因的五個表達量,畫在數軸上:

標準偏差(Standard Deviation)量化瞭一組測量值中的變化程度,標準偏差越小,這些值偏離平均值就越少。

二、標準誤差

同樣的實驗做五次,每次實驗用不同的樣本:

把五個樣本的平均值放在一個數軸:

可以計算得到兩個值:

對五個樣本的平均值取平均值,計算得到的標準偏差就是標準誤差(Standard Error)

標準誤差量化瞭多組測量值均值的變化程度。

不難發現:

  • 標準偏差量化瞭一組測量值中的變化程度
  • 標準誤差量化瞭多組測量值均值的變化程度

1、如何計算多組樣本的標準誤差

  • 抽取一組樣本,每個樣本都有相同數量的測量值
  • 計算每組樣本的均值
  • 利用均值計算標準誤差 Std.Err

可以發現標準誤差比標準偏差要小很多,這是因為平均值並沒有原始數據那麼分散。

當然也可以計算標準偏差的標準偏差,這個值叫做標準偏差的標準誤差。它告訴我們多個樣本的標準偏差是如何分佈的。

其實理論上,我們可以計算一切統計值的標準偏差,比如中位數,眾數,百分數等的標準偏差,得到的值就是該統計值的標準誤差。

標準誤差隻是來自同一群體的多個均值的標準偏差。

2、如何計算一組樣本中的標準誤差

自助抽樣法(Bootstrap)

  • 選取一個隨機測量值
  • 記錄該值
  • 重復以上兩步,直到拿到 5 個測量值
  • 計算均值,中位數,眾數等
  • 回到第一步,重復以上步驟,拿到多個統計量的值
  • 利用拿到的統計量的值,如均值計算標準偏差,得到標準誤差

當然也有其他方法,後面更新。

三、標準誤差的表示

下面是三個樣本

綠色:均值

紅色:標準偏差,也叫誤差棒(Error Bars)

如果不想展示原始數據,隻需要反應標準偏差和均值就行,也就是下面的TNT圖:

誤差棒(Error Bars)一般有三種類型:

  • 標準偏差(Standard Deviations)
  • 標準誤差(Standard Errors)
  • 置信區間(Confidence Intervals)

致謝:

https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw