複数のアウトカムに対する介入の効果を対照と比較して、集約し、正味の益 net benefitを計算するには、効果推定値の尺度(スケール)をすべてのアウトカムに対して同じにする必要があります。治癒・非治癒のような二値変数 binary/dichotomous variableの場合は、前回の投稿で解説したように、リスク差を用いれば共通の尺度になり、絶対効果を表し、直線関係が維持されます。しかし、連続変数アウトカムも取り扱う場合は、何らかの方法で変換する必要があります。
また、連続変数アウトカムだけを扱う場合も、複数のアウトカムがあれば、例えば、血清アルブミン値とHbA1cの様に単位が異なる、つまり、尺度が異なる場合、何らかの方法で変換し、共通の尺度にする必要があります。
以上のような変換をスコア化と呼びます。
多疾患を持つ高齢者に対する最善のケアを、いくつかの国、地域別に決めるEUのSELFIEプロジェクトでは、多基準決断分析 Multi-Criteria Decision Analysis (MCDA)により、17の異なる統合ケアプログラムと通常ケアプログラムの総バリュースコアを比較しています。以前そのようなEUのプロジェクトがあるということを紹介しました。アウトカムは、連続変数アウトカムのみで、費用も含まれています。各ケアプログラムの効果の大きさ(パフォーマンス)の尺度を合わせるため、各アウトカムに対する効果推定値に対して、標準化 Standardizationとスウィングウェイティング Swing-weightingという方法を用いて、スコア化を行って、重みづけ加算モデルで総バリュースコアを計算しています。なお、2群間の総バリュースコアの差はいわゆる正味の益に相当します。
標準化 Standardizationは、そのアウトカムに対する、介入群の効果推定値と対照群の効果推定値、すなわち絶対リスクから計算しますが、標準正規分布のZ値を求める計算と同じです。図の②に示す、分母は不偏標準偏差の計算に相当します。標準化によって、効果推定値が正の値だけであれば、0~1の範囲の値のスコアに変換されます。負の値も含まれる場合は、-1~+1の範囲の値に変換されます。
Swing-weightingは正規化 Nomalizationのひとつに相当します。図の①に示すように、あり得る最悪の推定値Wとあり得る最善の推定値Bを設定し、[(E – W)/(B – W)]×100でスコアに変換します。一般に正規化という場合、あり得る最悪の値に対して、最小値、あり得る最善の値に対して、最大値という呼び方をしています。100倍する前の値は、もし効果推定値が正の値だけであれば、0~1の範囲になります。負の値も含める場合は、-1~+1の範囲の値に変換されます。その点では、標準化と同じ範囲の値が得られます。
正味の益を求めるには、スコアに対し、各アウトカムの重要度を掛け算し、総和を計算します。SELFIEプロジェクトでは、スウィングウェイティング Swing-weightingと離散選択実験 Discrete Choice Experiment (DCE)二つの方法が用いられています。
・スウィングウェイティング Swing-weightingでは、最も重要なアウトカムを選択する際に、最悪の効果推定値‐最善の効果推定値の、振れ幅swingが最大のアウトカムを見つけ、そのアウトカム自体の重要度と合わせて、最重要としていいかを考えます。他により重要と思われるアウトカムがある場合、swingよりもそちらを優先して、そのアウトカムを最重要と決めます。そして、最重要のアウトカムを100とし、それ以外のアウトカムの相対的重要性をswingとアウトカム自体の重要性と両方を考慮して、重要度の値を設定していきます。
・離散選択実験 Discrete Choice Experiment (DCE)では、それぞれのアウトカムに対する対照と介入、すなわち2つの介入の効果について、仮想の値を設定し、さまざまな組み合わせを用意しておき、これらの組み合わせのペアを比較しながら、望ましいと思う方を選択させます。多数の被検者からの結果を集計し、回帰分析を適用して、アウトカムの重要度を決めます。
効果推定値には、不確実性が伴っていますが、95%信頼区間が分かっていれば、それらから正味の益の95%信頼区間を計算することができます。確率論的感度分析 Probabilistic Sensitivity Analysis (PSA)がそれに相当します。
正味の益の推定は、GRADEアプローチの完全文脈化Fully contextualized appraochによるエビデンス総体のエビデンスの確実性の評価にも関係があるので、何らかの方法を適用して計算する必要があるのですが、二値変数アウトカムと連続変数アウトカムの両方が含まれる場合には、Swing-weightingのような方法が必要になります。Swing-weightingについては、以前の投稿も参照してください。
文献:
Rutten-van Molken M, Leijten F, Hoedemakers M, Tsiachristas A, Verbeek N, Karimi M, Bal R, de Bont A, Islam K, Askildsen JE, Czypionka T, Kraus M, Huic M, Pitter JG, Vogt V, Stokes J, Baltaxe E, SELFIE consortium: Strengthening the evidence-base of integrated care for people with multi-morbidity in Europe using Multi-Criteria Decision Analysis (MCDA). BMC Health Serv Res 2018;18:576. doi: 10.1509/jmkr.41.4.392.47020 PMID: 30041653
SELFIEプロジェクトのウェブサイト SUSTAINABLE INTEGRATED CARE MODELS FOR MULTI-MORBIDITY DELIVERY, FINACING AND PERFOMANCE (SELFIE)
Thokala P, Devlin N, Marsh K, Baltussen R, Boysen M, Kalo Z, Longrenn T, Mussen F, Peacock S, Watkins J, Ijzerman M: Multiple Criteria Decision Analysis for Health Care Decision Making-An Introduction: Report 1 of the ISPOR MCDA Emerging Good Practices Task Force. Value Health 2016;19:1-13. PMID: 26797229
Marsh K, IJzerman M, Thokala P, Baltussen R, Boysen M, Kalo Z, Lonngren T, Mussen F, Peacock S, Watkins J, Devlin N, ISPOR Task Force: Multiple Criteria Decision Analysis for Health Care Decision Making-Emerging Good Practices: Report 2 of the ISPOR MCDA Emerging Good Practices Task Force. Value Health 2016;19:125-37. PMID: 27021745
Tervonen T, Veldwijk J, Payne K, Ng X, Levitan B, Lackey LG, Marsh K, Thokala P, Pignatti F, Donnelly A, Ho M: Quantitative Benefit-Risk Assessment in Medical Product Decision Making: A Good Practices Report of an ISPOR Task Force. Value Health 2023;26:449-460. doi: 10.1016/j.jval.2022.12.006 PMID: 37005055
Wen S, Zhang L, Yang B: Two approaches to incorporate clinical data uncertainty into multiple criteria decision analysis for benefit-risk assessment of medicinal products. Value Health 2014;17:619-28. PMID: 25128056
Ho M, Saha A, McCleary KK, Levitan B, Christopher S, Zandlo K, Braithwaite RS, Hauber AB, Medical Device Innovation Consortium’s Patient Centered Benefit-Risk Steering Committee: A Framework for Incorporating Patient Preferences Regarding Benefits and Risks into Regulatory Assessment of Medical Technologies. Value Health 2016;19:746-750. PMID: 27712701
Schünemann HJ, Neumann I, Hultcrantz M, Brignardello-Petersen R, Zeng L, Murad MH, Izcovich A, Morgano GP, Baldeh T, Santesso N, Cuello CG, Mbuagbaw L, Guyatt G, Wiercioch W, Piggott T, De Beer H, Vinceti M, Mathioudakis AG, Mayer MG, Mustafa R, Filippini T, Iorio A, Nieuwlaat R, Marcucci M, Coello PA, Bonovas S, Piovani D, Tomlinson G, Akl EA, GRADE Working Group: GRADE guidance 35: update on rating imprecision for assessing contextualized certainty of evidence and making decisions. J Clin Epidemiol 2022;150:225-242. doi: 10.1016/j.jclinepi.2022.07.015 PMID: 35934266
Hultcrantz M, Rind D, Akl EA, Treweek S, Mustafa RA, Iorio A, Alper BS, Meerpohl JJ, Murad MH, Ansari MT, Katikireddi SV, Östlund P, Tranæus S, Christensen R, Gartlehner G, Brozek J, Izcovich A, Schünemann H, Guyatt G: The GRADE Working Group clarifies the construct of certainty of evidence. J Clin Epidemiol 2017;87:4-13. doi: 10.1016/j.jclinepi.2017.05.006 PMID: 28529184