GRADE contextulizationによる分類は今後使用しない

2025年7月のAnnals of Internal MedicineにSchünemann教授たちがGRADE working groupの2024年9月の決定事項として、今後エビデンスの確実性評価の際に文脈化Contextualizationによる最小文脈化アプローチMinimally contextualized appproach、部分的文脈化のアプローチPartially contextualized approach完全文脈化のアプローチFully contextualized approachという言う分類はやめることにしたというショートレポートが出されています。引き続き、より詳細が論文として報告されるそうです。

Hultcrantz M, Schünemann HJ, Mustafa RA, Rind DM, Murad MH, Mayer M, Tovey D, Alper BS, Akl EA, Saif-Ur-Rahman KM, Sousa-Pinto B, Neumann I, Izcovich A, Guyatt G: GRADE Certainty Ratings: Thresholds Rather Than Categories of Contextualization (GRADE Guidance 41). Ann Intern Med 2025;178:1183-1186. doi: 10.7326/ANNALS-25-00548 PMID: 40587852

臨床の文脈、医療環境の文脈、医療資源の文脈など、文脈といわれるとより想起されやすい別の事項があるため、混乱を招く恐れがあるからそうしたらしいです。

ただし、エビデンスの確実性評価の方法・手順が変更になったわけではありません。小・中・大の決断閾値Decision thresholdsを設定して、アウトカムの重要度で重みづけした効果推定値の95%信頼区間/確信区間の交差の程度を見て、不精確性Imprecisionの評価をする、必要な場合はReview Information Size (RIS)も評価するという点は同じです。Imprecisionと他のドメイン、例えば、非一貫性Inconsistency, バイアスリスクRisk of bias等とのInteraction/相関関係を考慮し、グレードダウンは保守的に、というのも変わらないと思います。

「正味の益も考慮して決断閾値を設定した」、「当該アウトカムだけを考慮し、パネルメンバーの考えに基づいて閾値を設定した」、「他のアウトカムに対する効果の大きさと確実性も考慮して決断閾値を設定した」、「当該アウトウカムの重要性に関する報告に基づいて閾値を設定した」などと記述することになるのでしょう。

以前の投稿「GRADEアプローチのエビデンスの確実性評価:3種類の文脈化」はこちら

関連文献:

Hultcrantz M, et al: The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol 2017;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006 PMID: 28529184

Alper BS, et al: Defining certainty of net benefit: a GRADE concept paper. BMJ Open 2019;9:e027445. doi: 10.1007/s11882-011-0185-8 PMID: 31167868

Zeng L, et al: GRADE guidelines 32: GRADE offers guidance on choosing targets of GRADE certainty of evidence ratings. J Clin Epidemiol 2021;137:163-175. doi: 10.1016/j.jclinepi.2021.03.026 PMID: 33857619

Schünemann HJ, et al: GRADE guidance 35: update on rating imprecision for assessing contextualized certainty of evidence and making decisions. J Clin Epidemiol 2022;150:225-242. doi: 10.1016/j.jclinepi.2022.07.015 PMID: 35934266

GRADE EtDフレームワークとMCDA

GRADE (Evidence-to-Decision) EtDフレームワークは複数の基準項目について、リサーチエビデンスと追加的考察に基づいて判断し、全体をまとめて推奨を作成する枠組みですが、診療ガイドライン作成パネルの議論・審議をリードするのが大きな役割です。

Multi-Criteria Decision Analysis (MCDA)多基準意思決定分析(多基準決断分析)では複数の基準項目(アウトカムなど)についてパフォーマンス(効果の大きさ)と基準項目の重要度から重みづけ加算モデルで一つの値を計算し、それによって最善の選択肢を決めることができます。評価者の価値観により重要度を変えて、それぞれに最善の選択肢を選択することに役立ちます。

GRADE EtDフレームワークもMCDAも思想的な背景は同じです。前者は議論・審議に重きを置き、後者は関係するパラメータを数値化して定量的に評価します。これら2つのアプローチの関係を理解することと、診療ガイドラインの推奨作成にMCDAを活用できるようにすることは重要だと思います。

解説動画とPDFを作成しました。

PDF 「GRADE EtDフレームワークとMCDAの関係性」

動画はNotebookLMで作成しました。PDFファイルはGammaで作成しました。

主な文献:
Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Vandvik PO, Meerpohl J, Guyatt GH, Schünemann HJ, GRADE Working Group: GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ 2016;353:i2089. doi: 10.1136/bmj.i2089 PMID: 27365494

Alonso-Coello P, Schünemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, Treweek S, Mustafa RA, Rada G, Rosenbaum S, Morelli A, Guyatt GH, Oxman AD, GRADE Working Group: GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ 2016;353:i2016. doi: 10.1136/bmj.i2016 PMID: 27353417

Moberg J, Alonso-Coello P, Oxman AD. GRADE Evidence to Decision (EtD) Frameworks Guidance. Version 1.1 [updated May 2015], The GRADE Working Group, 2015. Available from:
https://ietd.epistemonikos.org/#/help/guidance

FDAのStructured Benefit-Risk FrameworkとPatient’s preference information (PPI)

FDA(米国食品医薬品局)の医療機器・放射線保健センター(CDRH)と医療機器イノベーションコンソーシアム(MDIC)が共同で開発したMDIC患者中心ベネフィット・リスク(PCBR)フレームワークについて、以前紹介しました(351, 436)。

当局の許認可を目的とする治験で、Patient’s preference information(PPI, 患者の選好に関する情報)を調査、記録することが重視されており、申請時にStructured Benefit Risk Frameworkを用いることが求められているようです。

今回、これらについてまとめて、2つのPDFファイルを作成しました。作成にはGoogle NotebookLMgammaを使いました。

・FDAのStructured Benefit-Risk Framework: 医薬品評価における透明性と一貫性の確保 PDF

・FDAのStructured Benefit-Risk Frameworkと患者選好情報 (PPI) PDF

用語を確認しておきましょう:

Importance of outcome アウトカムの重要性/重要度、Values価値観、Preferences選好の関係は以下の様に表現されると思います。GRADE Working Groupはアウトカムの重要度と患者の価値観は同じことを意味しており、文脈により使い分けると述べています。

文献:
Ho M, Saha A, McCleary KK, Levitan B, Christopher S, Zandlo K, Braithwaite RS, Hauber AB: A Framework for Incorporating Patient Preferences Regarding Benefits and Risks into Regulatory Assessment of Medical Technologies. Value Health. 2016;19:746-750. doi: 10.1016/j.jval.2016.02.019 doi: 10.1016/j.jval.2016.02.019 PMID: 27712701

•Boyd CM, Singh S, Varadhan R, Weiss CO, Sharma R, Bass EB, Puhan MA. Methods for Benefit and Harm Assessment in Systematic Reviews. Methods Research Report. (Prepared by the Johns Hopkins University Evidence-based Practice Center under contract No. 290-2007-10061-I). AHRQ Publication No. 12(13)-EHC150-EF. Rockville, MD: Agency for Healthcare Research and Quality; November 2012. Link

Alper BS, Oettgen P, Kunnamo I, Iorio A, Ansari MT, Murad MH, Meerpohl JJ, Qaseem A, Hultcrantz M, Schünemann HJ, Guyatt G, GRADE Working Group: Defining certainty of net benefit: a GRADE concept paper. BMJ Open 2019;9:e027445. PMID: 31167868

ベイジアンネットワークメタアナリシスのためのRパッケージgemtcで取り扱うデータ形式

ネットワークメタアナリシスでは、3つ以上の介入あるいは治療の効果を複数の研究からまとめて比較し、直接比較だけでなく間接比較のデータも含めて、各ペアを比較する効果指標の統合値と信頼区間(あるいはは確信区間)および効果の大きさの順位を知ることができます。ペア比較メタアナリシスは二つの介入のうち、どちらを選択すべきかという問題に解答を与えてくれますが、ネットワークメタアナリシスは三つ以上の介入のうちどれを選択すべきか、言い換えると最善の介入はどれかという問題に解答を与えてくれる可能性があります。→参考情報

ネットワークメタアナリシス用のソフトウェアとして、頻度論派メタアナリシスのためにはnetmetaというRのパッケージがありますが、gemtcはベイジアンネットワークメタアナリシスのためのRのパッケージで、rjagsというRのパッケージを介してJAGS (Just Another Gibbs Sampler)でMCMC(Malkov Chain Monte Carlo)シミュレーションを実行させます。JAGSとrjagsはあらかじめインストールしておきます。Rで使用する際には、library(rjags);library(gemtc)を最初に実行する必要があるのは、他のRのパッケージと同じです。

MCMCでは事後分布から、必要に応じて、数万から100万程度のサンプリング値を得るので、実行には時間がかかります。事前分布にはほぼ平坦な分布を用いますが、既知の情報に基づいて設定することもできます。

gemtcでは連続変数アウトカムの場合、平均値差Mean Difference (MD)を効果指標として取り扱えますが、最近、標準化平均値差Standardized Mean Difference (SMD)も取り扱えるようになりました。各研究からアームごとの研究ID、治療、平均値、標準偏差、サンプルサイズのデータを抽出します。列名はstudy, treatment, mean, std.dev, sampleSizeとします。同じ研究内では最初の行が参照アームになります。

このようなデータ形式をArm-level dataと呼んでいます。また、あらかじめ計算した平均値差とその標準誤差、あるいは、標準化平均値差とその標準誤差からもネットワークメタアナリシスを実行することもできます。この場合でも、netmetaなどのデータ形式と異なり、1行アームの形式になります。列名はstudy, treatment, diff, std.errとなります。このようなデータ形式をRelative effect dataと呼んでいます。

1つの行に2つのアームを比較した相対的効果指標とその標準誤差が含まれているのですが、参照アームの行も必要で、参照アームのdiffの欄はNAとします。2アームだけしかない場合は、std.errの欄もNAで問題ないのですが、3アーム以上ある場合は、参照アームのstd.errには参照アームの標準誤差の値が必要になります。平均値差であれば、対照アームの標準偏差をサンプルサイズの平方根で割り算した値になりますし、標準化平均値差の場合はサンプルサイズの平方根の逆数になります。参照アームの標準誤差の値がNAだとモデル作成時にエラーになります。

通常は、元データとして、各アームの平均値と標準偏差を用意したほうがいいでしょう。一部の研究で例えば、平均値差と標準誤差、あるいは標準化平均値差と標準誤差のデータしか得られないような場合、他の研究について、これらの相対効果指標と標準誤差を計算して解析するような場合は、Relative effect dataを使うことになるでしょう。

gemtcでは最初に、mtc.network()関数でネットワークオブジェクトを作成しますが、Arm-level dataの場合は、netw=mtc.network(data.ab=data)と記述し、Relative effect dataの場合は、netw=mtc.network(data.re=data)と記述します。

mtc.model()関数は変数netwに対して演算処理を行いますが、likelihoodとlinkの引数に効果指標のタイプに応じた値を設定する必要があります。元データが平均値と標準偏差の場合は、likelihood=”normal”, link=”identity”とすると、統合値は平均値差になります。liklihood=”normal”, link=”smd”とすると統合値は標準化平均値差になります。標準化平均値差はHedge’s gが用いられています。Cohen’s dに対し、サンプルサイズが小さい場合のずれを調整する項が追加されています。

元データが、Relative effect dataで、平均値差と標準誤差の場合、likelihood=”normal”, link=”identity”とすると、統合値は平均値差になります。

元データが、Relative effect dataで、標準化平均値差と標準誤差の場合、likelihood=”normal”, link=”identity”とすると、統合値は標準化平均値差になります。ただし、gemtcのforest()関数で、フォレストプロットを作成すると、ラベルがMean Differenceとなりますので、あとで画像として開いて書き換えるか、forestplotパッケージを使うなどして、別の方法でフォレストプロットを作成する必要があります。

例えば、netw = mtc.network(data.ab = data)で作成したネットワークオブジェクトの変数名がnetwだとすると、次のステップではmtc.model()関数で、netwに対してモデル作成を行います。

model <- mtc.model(netw, likelihood = lh, link = lk, linearModel=rndfix, n.chain=chain )

変数lh, lkには上記の文字列を格納します。ランダム効果モデルの場合は、rndfix = “random”とします。chainはMCMCを繰り返す回数です、例えば、chain=4とします。

その後、例えば、以下の様にMCMCを実行させます。

burnin = 10000
iteration = 110000
thin = 1
res <- mtc.run(model, n.adapt = burnin, n.iter = iteration, thin = thin)

以上を解説したPDFのスライドファイルをこちらで閲覧できます(4.3MB)。

gemtcはもちろん、リスク比、リスク差、オッズ比、ハザード比も取り扱えます。元データのフォーマットと、likelihood、linkの設定が分からないと、使えないので、今回特に、連続変数アウトカムの場合について、解説しました。実際のRのスクリプトやMCMCの結果の利用法についてはいつか解説したいと思います。