SoF tableから正味の益 Net benefitの分析へ-1

GRADEアプローチではエビデンス評価のまとめとして、”Evidence profile”と、さらに”SoF (Summary of Findings) table”を作成することになっています。SoF tableは単なる結果のまとめ表ではありません、SoF tableには次の7つの要素を含める必要があります。

1.すべての重要+重大なアウトカムおよびエビデンス総体の総括
2.これらアウトカムのベースラインリスク
3.介入群の絶対リスク(イベント率)、あるいは絶対リスク減少=絶対効果指標
4.リスク比、ハザード比などの相対効果指標
5.参加者の人数(総数)と研究数
6.アウトカムごとのエビデンス総体のエビデンスの確実性:ABCD4段階
7.コメント。

SoF tableの最大の目的はアウトカムごとのエビデンス総体のエビデンスの確実性を示すことではなく、望ましい効果=益Benefitと望ましくない効果=害Harmの大きさとバランスを分析するために必要な絶対リスクと絶対効果指標を示すことであると言えます。

益と害の大きさとバランスを分析するには、批判的吟味、エビデンスの確実性の評価を超えた知識・スキルが必要です。”Decision analysis”決断分析、定量的な益と害の分析、確率的感度分析を行うのであれば、統計学、モンテカルロシミュレーションの知識・スキルも必要になります。

益と害のバランス=正味の益を知るには、①測定されたアウトカムが有益な事象か有害な事象か、すなわち効果推定値が大きい方が望ましい効果なのか逆に小さい方が望ましい効果なのかをまず明確にする必要があります。そして、②アウトカムが二値変数の場合は、絶対リスク(各群のイベント率)または絶対リスク減少=リスク差、連続変数の場合は、絶対リスク(各群の平均値)または平均値差が必要になります。さらに、③アウトカムの重要性を設定する必要があります。SoF tableでは②を含めることを求めていると言えます。ここでのアウトカムの重要性は、患者の価値観と同じ意味で、クリニカルクエスチョン設定時のSRの施行の必要性、エビデンス総体の総括の評価に用いるかどうか、推奨を決めるのに用いるかどうかを決めるアウトカムの重要性の設定とは異なります。そのアウトカムに患者あるいは個人が、アウトカム間で相対的にどの程度の価値を置くかということです。

また、WHOのGRADEprofiler helpでは、5.5.1.6.1 Calculation of absolute effectで相対効果指標から絶対効果を求める方法が紹介されています。対照群のイベント率をCERとします。オッズ比ORの場合は、OR/[1 – CER×(1 – OR)]でリスク比RRに変換し、ハザード比HRの場合は、[1 – exp{HR×ln(1 – CER)}]/CERでリスク比RRに変換します。リスク比RRからは、CER×(1 – RR)で絶対効果の値が得られます。この値は、リスク差あるいは絶対リスク減少に相当し、100倍すれば100人あたり、1000倍すれば1000人当たり、10000倍すれば10000人当たりの効果が確認できる人数が得られることになります。expはexponential、lnは自然対数です。

益と害のバランスあるいは正味の益、絶対効果、絶対リスク、ベースラインリスク、ハザード率とハザード比とイベント率、アウトカムの重要性と価値観、これらについて理解したうえで、Multi-Criteria Decision Analysis (MCDA)多基準決断分析、Quantitative Benefit-Risk AnalysisあるいはQuantitative-Benefit Harm Analysis定量的な益と害の分析について理解することは、推奨作成において今後より重要になると思います。 定量的な益と害の分析について は、すでにこれまで解説してきましたが、まだ解説していないGail/NCIの方法も含めて、より総合的にわかりやすく解説したいと思っています。今回は、図1と図2をどこまで理解できるか、考えてみてください。

  • Gail MH, Costantino JP, Bryant J, Croyle R, Freedman L, Helzlsouer K, Vogel V: Weighing the risks and benefits of tamoxifen treatment for preventing breast cancer. J Natl Cancer Inst 1999;91:1829-46. PMID: 10547390 
  • Multi-Criteria Decision Analysis (MDCA)>
  • Multi-Criteria Decision Analysis (MCDA)のステップ >
  • Keeney and RaiffaのSwing weightingを用いたMCDA >
  • Swing weightingを用いたMCDAの結果 >
  • EMAのBenefit-risk methodology >
  • FDAのBenefit-Risk Assessment Framework >
  • FDAのBenefit-Risk Assessment(続き) >

エビデンスがないNo evidence

「。。。にはエビデンスがない」と言ったらその後には何が続くでしょう?

おそらく、「。。。はしない方がいい」でしょう。「。。。にはエビデンスがある」だったら?

おそらく、「。。。をした方がいい」でしょう。

果たしてこれでいいのでしょうか?

診療ガイドラインで推奨を作成する場合は、「。。。にはエビデンスがないから」「。。。をしないことを推奨する」でしょうか?「。。。にはエビデンスがあるから」「。。。をすることを推奨する」でしょうか?

エビデンスとはある・なしのどちらかでしょうか?さらに、益のエビデンスと害のエビデンスと両方考える必要があります。

US Preventive Task Force (USPSTF)は、推奨をA, B, C, D, Iに分類していることについて以前の投稿の中で述べました。この中で、Grade Cは”USPSTFは、専門家の判断と患者の好みPreferencesに基づいて、選択的に個人個人の患者に提供することを推奨する。正味の益が小さいことに少なくとも中等度の確実性がある”と定義されています。患者の好みPreferencesは患者の価値観と同義と考えてください。

Grade Iは”USPSTFは、現在のエビデンスがそのサービスの益と害のバランスを評価するのに不十分であると結論付ける。エビデンスはないか、貧弱か、あるいは矛盾しており、益と害のバランスを決められない”と定義されています。

益と害のバランスthe balance of benefits and harmsは正味の益the net benefitと同じ意味です。正味の益は、”The net benefit is defined as benefit minus harm of the preventive service as implemented in a general, primary care population. ” すなわち、その予防医療サービスが一般のプライマリケア集団で実行されるときの益ひく害が正味の益と定義される、と。ここでは益から害を減じた(引き算した)値を正味の益Net benefitと定義しています。

以上を前提に、Braithwaite RSの”EBM’s six dangerous words.” (文献)の意味を考えてみましょう。

“EBM’s six dangerous words.”とは”There is no evidence to suggest…”の6つの言葉のことです。つまり、「。。。を提案(示唆)するエビデンスはない」という表現のことです。

Braithwaite RSのこの論文における主張は、この表現は4つの意味でつかわれているので、そのどれなのかをわかるように最初からそれら4つの内のどれかの表現を使いましょうということです。

1.科学的エビデンスは決定的ではなく、どれが最善か分らない。(USPSTF Grade Iでベイジアン無情報事前分布の場合)
2.科学的エビデンスは決定的ではないが私の経験あるいはその他の知識は”X”を示唆する。(USPSTF Grade Iで”X”を示唆するベイジアン有情報事前分布の場合)
3.これは益がないことが証明されている(USPSTF Grade D)
4.これはどっちつかずで、ある患者には益が害を上回り、別の患者にはそうではない(USPSTF Grade C)

1の場合、USPSTFは、”臨床的考察のセクションを読み、もし、そのサービスを提供するのであれば、患者は益と害のバランスの不確実性を理解すべきである”とSuggestions for Practiceで述べています。すべきではないと決めつけているわけではありません。

2の場合は、1の場合と同様ですが、1と比べるとそのサービスが提供される可能性が高くなるでしょう。

1,2で事前分布Priorと言っているのは、Braithwaite RSです。USPSTFの記述にはありません。彼の考えは、その時点における仮説Hypothesisがあって、それが正しい確率P(H)が、その後データDataが得られるとその正しい確率P(H|D)はデータが正しい確率P(D)とその仮説が正しい時にそのデータが得られる確率P(D|H)によって決まるというベイズの定理の、P(H)のことです。P(H|D) = P(D|H)×P(H)/P(D)の式で表されます。

つまり、エビデンスが決定的でない、不確実性が高い場合でも、その程度は異なり、”私の経験あるいはその他の知識”の正しい確率=P(H)に相当する値は様々で、1の場合は、それが0に近い、2の場合は、もう少し大きいということになります。つまり、”今までの自分の経験や間接的なデータ、研究結果から、Xが有効の可能性が少しある”という場合と、”全くわからないが、Xはまず効果がある可能性は殆どゼロ”という場合では、判断が違ってきます。

3の場合は、害が益を上回る状態になります。だから、しない方がいい。

4の場合は、患者の価値観によって、ある患者にはすることになり、別の患者にはしなことになります。

とうことから、エビデンスがないからと言って、してはいけないという決断をすると多くの場合、間違った決断になってしまうでしょう。

臨床の現場では、何もしないという選択肢も含めて、どれかに決める必要があります。その際に、エビデンスがないからしない、という考え、また、診療ガイドラインにおいて、ランダム化比較試験がない領域では、推奨を作成することはできないという考えは、偏った考えではないでしょうか。

エビデンスの確実性は、All or nothingあるいは1か0かではありません。Quantitative Benefit-Risk Assessmentを行う際には、エビデンスの確実性を表すのに、確率分布を使います。以前の投稿、益と害の定量的評価法 Quantitative benefit-harm assessmentKeeney and RaiffaのSwing weightingを用いたMCDASwing weightingを用いたMCDAの結果、などを参照してください。

文献
Braithwaite RS: A piece of my mind. EBM’s six dangerous words. JAMA 2013;310:2149-50. doi: 10.1001/jama.2013.281996 PMID: 24281458

同じ論文が2020年に再掲されています。
Braithwaite RS: EBM’s Six Dangerous Words. JAMA 2020;323:1676-1677. doi: 10.1001/jama.2020.2855 PMID: 32369132

診療ガイドラインの活用促進

診療ガイドラインの普及、活用促進と推奨の順守の向上は科学的エビデンスに基づく診療ガイドラインの作成と同じくらい重要な課題です。それぞれの推奨が着実に実行されることで、医療が改善し、患者アウトカムが改善することが期待されます。しかし、診療ガイドラインの普及、活用そして推奨の順守はさまざまな因子の影響を受け、それらの程度は十分とは言えないのが現状です。

診療ガイドラインの開発の問題、推奨の提示の問題、診療ガイドラインの普及の問題、推奨の医療システムへの取り込みの問題、ICT活用の問題、医療提供者のニーズに十分応えられていない問題、患者のニーズに十分応えられていない問題、最新情報が取り込まれていない問題、新しい臨床研究への発展につなげられない問題、その他さまざまな問題を指摘することができるでしょう。

これらの問題に対処すべくさまざまな試みが行われています。すべての問題を解決するにはあらゆるステークホルダーの参加が必要になるでしょう。医療提供者が中心の診療ガイドライン作成者だけでは解決できない問題もあります。

2015年に発表されたBousquet Jらの”MACVIA-ARIA Sentinel NetworK for allergic rhinitis (MASK-rhinitis): the new generation guideline implementation”「アレルギー性鼻炎のためのMACVIA-ARIAセンチネルネットワーク(MASK-鼻炎):新世代のガイドライン導入」と題する論文は、多数の著者が名を連ねており日本からもいくつかの施設が参加している、アレルギー性鼻炎に対する国際的な試みについて述べています。European Innovation Partnership on ActiveとHealthy Ageing (EIP on AHA)のB3計画の一環として行われた研究です。タイトルに「新世代のガイドライン導入」とうたわれている程、革新的な大規模な試みと考えられます。

MACVIA-LR Contre les MAladies Chroniques pour un VIeillissement Actif en Languedoc‐Roussillon  (Fighting chronic diseases for active and healthy ageing) http://macvia.cr-languedocroussillon.fr) is a reference site of the European Innovation Partnership on Active and Healthy Ageing

ARIA Allergic Rhinitis and its Impact on Asthma
CARAT Control of Allergic Rhinitis and Asthma Test
MASK MACVIA-ARIA

診療ガイドラインと臨床決断支援ツールにICTを活用した以下の3つのツールが開発され、多言語で提供されています:
1.携帯電話(スマートフォン)による毎日のVisual Analogue Scale (VAS)による疾患コントロールの評価。
2.アレルギー性鼻炎と喘息検査のコントロール(CARAT, Control of Allergic Rhinitis and Asthma Test)。
3.医療前のオンラインツールによるアレルギーと喘息の早期診断(e-Allergy screening)。

MASK-rhinitisは、アレルギー性鼻炎の 診断、層別化、マネージメントおよび治療効果の評価のための新しいツールを代表するものであると述べられています。

また、Rapid guidelines, Living systematic reviews, Living guideline recommendationsなどの試みも広がりをみせ、クラスターランダム化比較試験で診療ガイドラインの有効性を実証しようとする試みも行われてきています。いくつかの論文を文献欄にあげておきます。

文献
Bousquet J, Schunemann HJ, Fonseca J, Samolinski B, Bachert C, Canonica GW, et al: MACVIA-ARIA Sentinel NetworK for allergic rhinitis (MASK-rhinitis): the new generation guideline implementation. Allergy 2015;70:1372-92. doi: 10.1111/all.12686 PMID: 26148220

Kowalski SC, Morgan RL, Falavigna M, Florez ID, Etxeandia-Ikobaltzeta I, Wiercioch W, Zhang Y, Sakhia F, Ivanova L, Santesso N, Schünemann HJ: Development of rapid guidelines: 1. Systematic survey of current practices and methods. Health Res Policy Syst 2018;16:61. doi: 10.1186/s12961-018-0327-8 PMID: 30005712

Florez ID, Morgan RL, Falavigna M, Kowalski SC, Zhang Y, Etxeandia-Ikobaltzeta I, Santesso N, Wiercioch W, Schünemann HJ: Development of rapid guidelines: 2. A qualitative study with WHO guideline developers. Health Res Policy Syst 2018;16:62. doi: 10.1186/s12961-018-0329-6 PMID: 30005710

Morgan RL, Florez I, Falavigna M, Kowalski S, Akl EA, Thayer KA, Rooney A, Schünemann HJ: Development of rapid guidelines: 3. GIN-McMaster Guideline Development Checklist extension for rapid recommendations. Health Res Policy Syst 2018;16:63. doi: 10.1186/s12961-018-0330-0 PMID: 30005679

Akl EA, Meerpohl JJ, Elliott J, Kahale LA, Schünemann HJ, Living Systematic Review Network: Living systematic reviews: 4. Living guideline recommendations. J Clin Epidemiol 2017;91:47-53. doi: 10.1016/j.jclinepi.2017.08.009 PMID: 28911999

Pai M, Lloyd NS, Cheng J, Thabane L, Spencer FA, Cook DJ, Haynes RB, Schünemann HJ, Douketis JD: Strategies to enhance venous thromboprophylaxis in hospitalized medical patients (SENTRY): a pilot cluster randomized trial. Implement Sci 2013;8:1. doi: 10.1186/1748-5908-8-1 PMID: 23279972

Aakhus E, Granlund I, Odgaard-Jensen J, Oxman AD, Flottorp SA: A tailored intervention to implement guideline recommendations for elderly patients with depression in primary care: a pragmatic cluster randomised trial. Implement Sci 2016;11:32. doi: 10.1186/s13012-016-0397-3 PMID: 26956726

Bias adjustment thresholds

2019年にAnnals of Internal MedicineにPhillippo DMらからネットワークメタアナリシスによるエビデンスの確実性からさらに臨床決断へのバイアスの影響を評価する方法について新しい手法が報告されました(1)。GRADE (Grading of Recommendations Assessment, Development and Evaluation)のエビデンス総体の確実性の評価方法(2, 3)と比較した結果が述べられています。

Bias adjustment thresholdsを用いる方法です。GRADEアプローチではバイアスリスク、非直接性、不精確性、非一貫性、出版バイアスを評価し、複数の研究をまとめたエビデンス総体の確実性の評価を行いますが、直接、臨床決断あるいは推奨への影響を評価するわけではありません。Phillippo DMらの方法では、臨床決断を逆転させるバイアスの閾値を評価し、実際の研究の結果に対してそれ以上のバイアスの影響があるかどうかを判断して、臨床決断が逆転しうるかどうかを解析しています。実際にGRADEの方法を用いた場合と異なる結論が得られることが示されています。

Phillippo DMらの論文は、もともと2016年に発表された同じグループのCaldwell DMらの論文(4)がもとになっています。さらに、2018年にはJournal of Royal Statistical SocietyのSeries AにPhillippo DM, Dias S, Ades AEらの論文(5)として発表されています。Journal of Royal Statistical Societyには2009年にTurner RMらのバイアスの定量的モデル化の論文(6)が発表されており、当然のことながら引用されています。

ネットワークメタアナリシスだけでなく通常のペア比較のメタアナリシスについても同じ手法が適用可能です。非常に重要な論文だと思います。

文献:
(1) Phillippo DM, Dias S, Welton NJ, Caldwell DM, Taske N, Ades AE: Threshold Analysis as an Alternative to GRADE for Assessing Confidence in Guideline Recommendations Based on Network Meta-analyses. Ann Intern Med 2019;170:538-546. PMID: 30909295
(2) Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, Atkins D, Kunz R, Montori V, Jaeschke R, Rind D, Dahm P, Akl EA, Meerpohl J, Vist G, Berliner E, Norris S, Falck-Ytter Y, Schünemann HJ: GRADE guidelines: 11. Making an overall rating of confidence in effect estimates for a single outcome and for all outcomes. J Clin Epidemiol 2013;66:151-7. PMID: 22542023
(3) Balshem H, Helfand M, Schünemann HJ, Oxman AD, Kunz R, Brozek J, Vist GE, Falck-Ytter Y, Meerpohl J, Norris S, Guyatt GH: GRADE guidelines: 3. Rating the quality of evidence. J Clin Epidemiol 2011;64:401-6. PMID: 21208779
(4) Caldwell DM, Ades AE, Dias S, Watkins S, Li T, Taske N, Naidoo B, Welton NJ: A threshold analysis assessed the credibility of conclusions from network meta-analysis. J Clin Epidemiol 2016;80:68-76. PMID: 27430731
(5) Phillippo DM, Dias S, Ades AE, Didelez V, Welton NJ: Sensitivity of treatment recommendations to bias in network meta-analysis. J R Stat Soc Ser A Stat Soc 2018;181:843-867. PMID: 30449954
(6) Turner RM, Spiegelhalter DJ, Smith GC, Thompson SG: Bias modelling in evidence synthesis. J R Stat Soc Ser A Stat Soc 2009;172:21-47. PMID: 19381328

下の図を見て、バイアスの効果についてちょっと考えてみてください。

Bias effects. RR: Risk Ratio; Log (Natural logarithm) of RR normally distribute and are additive, while on ratio scale RR is multiplicative.