E值(E-value):評估未測量混雜效應

八进制 2024-05-09 09:00 11次浏览 0 条评论 taohigo.com

首發於GitHub

為什麼要介紹E-value

  • 常規的敏感性分析(Sensitivity Analysis)存在主觀性:研究者可以選擇讓自己的結果更強健的敏感性參數
  • 評估假設所需要的假設:敏感性分析的本質是為瞭評估改變研究所基於的假設,研究結果是否會出現變化。然而,為瞭進行敏感性分析,往往需要新的假設。
  • 復雜:很多敏感性分析方法非常復雜,很多研究者都不能很好的使用和闡述結果。
  • 不容易發表:占用太多版面,如果刊物沒有補充性材料的部分,很可能會要求研究者刪掉敏感性分析的內容。

E值是什麼?

英文定義: the minimum strength of association, on the risk ratio scale, that an unmeasured confounder would need to have with both the treatment and the outcome to fully explain away a specific treatment-outcome association, conditional on the measured confounding(VanderWeele and Ding,2017)

簡單來說:E值就是,在控制已測量混雜因素的條件下,如果未測量的混雜效應想要完全抹掉你研究中的Risk Ratio(你研究中得到的暴露和結果之間的關聯效應),那未測量混雜效應最小要是多少才能達到這個目的。 主要用處:去評估未測量混雜因素對觀察型研究中的因果結論所產生的潛在影響

假設

沒有假設。

註釋

E:暴露;

D:結果;

C:已測量混雜因素;

U:一個或多個未測量混雜因素(不一定是二元,可以是多個類,用k表示);

RR:Risk Ratio

參數

在已測量混雜因素C等於c的分層中,基於你研究數據所觀察到的Risk Ratio(暴露和結果之間)。簡單來說就是,你控制瞭那些已測量的混雜因素以後,得到的暴露和結果之間的RR。

在已測量混雜因素C等於c的分層中,當未測量混雜因素U=k的時候,未測量混雜因素和暴露之間的Risk Ratio。

因為U可以是多個,而且類別也可以是多個,那麼我們隻取所有這些未測量混雜因素和暴露之間的RRs中的最大值,可以得到:

在已測量混雜因素C等於c的分層中,未測量混雜因素和暴露之間的最大Risk Ratio。也就是,最大程度的相關效應。 在已測量混雜因素C等於c的分層中,未暴露的組裡,未測量混雜因素U和結果之間最大的Risk Ratio。在已測量混雜因素C等於c的分層中,暴露的組裡,未測量混雜因素U和結果之間最大的Risk Ratio。

然後,我們還是隻想要得到一個未測量混雜和結果之間的最大RR:

在已測量混雜因素C等於c的分層中,未測量混雜因素和結果之間的最大Risk Ratio。也就是,最大程度的相關效應。 在已測量混雜因素C等於c的分層中,真實的因果性Risk Ratio(暴露和結果之間)

B因子和E值

因為RR本身可以>1也可以<1,而這會影響具體的等式,所以需要分開討論。

這裡的基本邏輯是利用不等式找到一個臨界點,這也是為什麼上面參數部分一直在用最大值。

如果 RR_{ED|c}^{obs} > 1 , 根據上面的參數,利用不等式,最後可以推出真實的RR和觀察到的RR之間的不等關系(具體過程不講瞭):

如果 RR_{ED|c}^{obs} < 1 , 根據上面的參數,利用不等式,最後可以推出真實的RR和觀察到的RR之間的不等關系(具體過程不講瞭):

B因素,Bounding Factor,代表未測量混雜因素削減觀察到的RR(暴露和結果之間的關聯效應)所能達到的最大因子。

我們同時也可以等到E-value。

如果 RR_{ED|c}^{obs} > 1, max(RR_{EU|c}, RR_{UD|c}) geq E-Value = RR_{ED|C}^{obs} + sqrt{RR_{ED|c}^{obs} times (RR_{ED|c}^{obs} – 1)}

置信區間以及 RR_{ED|c}^{obs} < 1 的情況可以看下圖。E值>=1。

例子(VanderWeele and Ding,2017)

  • 是否母乳喂養和是否發生嬰兒的呼吸系統疾病致死
  • 觀察到的RR=3.9 (95% CI:1.8,8.7)
  • 已經控制瞭已測量的混雜因素
  1. 計算B因子
  • 假設 RR_{UD} 最大值是4, RR_{EU} 最大值是2
  • B = 4 times frac{2}{4+2-1} = 1.6
  • RR^{true} geq 3.9/1.6 = 2.43 (95% CI: 1.1, 5.4)
  • 未測量混雜因素是不足以完全抹掉暴露和結果之間的關聯效應的

2. 計算E值

    • E值 = 3.9 + sqrt{3.9 times (3.9-1)} = 7.26
    • 觀察到的RR(3.9)在如下情況下,可以被未測量混雜效應完全解釋掉:未測量混雜因素和暴露以及因果兩個都至少有7.26的RR,而且是在控制瞭已測量混雜因素的情況下。

3. E值的圖(如下)

  • 大的E值表示,很大的未測量混雜效應才能解釋掉我們的RR
  • 小的E值表示,很小的未測量混雜效應才能解釋掉我們的RR
  • 大或小都是相對於我們的暴露和結果而言的

優勢和劣勢

優勢包括:

  • 不需要假設(給出一個保守的結果)
  • 計算簡單、方便報告和闡述
  • 可以使用其他測量(Odds Ratio、Hazard Ratio、計數、連續性結果變量)
  • 減少主觀性

劣勢包括:

  • 如果知道未測量混雜因素是什麼,同時知道它很少發生,那就不適合使用E值
  • E值不可以用來當作證據去證明你的研究沒有關聯效應
  • 如果未測量混雜因素太多,類別太多或者是連續型,可能很難闡述
  • 其他的偏倚,例如選擇偏倚、測量誤差也可能會削弱我們的因果效應

應用

  • R包:EValue
  • Stata模塊:EVALUE
  • 網站: evalue-calculator

參考文獻

•DING P & VANDERWEELE TJ (2016). SENSITIVITY ANALYSIS WITHOUT ASSUMPTIONS. EPIDEMIOLOGY, 27(3), 368–377.

•VANDERWEELE TJ & DING P (2017). SENSITIVITY ANALYSIS IN OBSERVATIONAL RESEARCH: INTRODUCING THE E-VALUE. ANNALS OF INTERNAL MEDICINE, 167(4), 268-274.

•VANDERWEELE TJ, MATHUR MB, & DING P (2019B). CORRECTING MISINTERPRETATIONS OF THE E-VALUE. ANNALS OF INTERNAL MEDICINE 170(2), 131-132.

•MATHUR MB, DING P, RIDDELL CA, & VANDERWEELE TJ (2018). WEBSITE AND R PACKAGE FOR COMPUTING E-VALUES. EPIDEMIOLOGY 29(5), E45-E47.

•THABANE, L., MBUAGBAW, L., ZHANG, S. ET AL. A TUTORIAL ON SENSITIVITY ANALYSES IN CLINICAL TRIALS: THE WHAT, WHY, WHEN AND HOW. BMC MED RES METHODOL13, 92 (2013). HTTPS://DOI.ORG/10.1186/1471-2288-13-92

•VELENTGAS P, DREYER NA, NOURJAH P, SMITH SR, TORCHIA MM, EDS. DEVELOPING A PROTOCOL FOR OBSERVATIONAL COMPARATIVE EFFECTIVENESS RESEARCH: A USER’S GUIDE. AHRQ PUBLICATION NO. 12(13)-EHC099. ROCKVILLE, MD: AGENCY FOR HEALTHCARE RESEARCH AND QUALITY; JANUARY 2013. WWW.EFFECTIVEHEALTHCARE.AHRQ.GOV/METHODS-OCER.CFM.