治療閾値Treatment threshold

治療閾値について理解するためには、期待効用、疾患確率についての知識が必要になります。

疾患確率は、その人が想定する疾患に罹患している確率です。ここではP(D+)で表しています。確率ですから、0~1の値を取ります。100人の人がいて、その内の50人がある疾患に罹患しているとします。その100人の中から、1人が特別な理由なく、やってきました。その人がその疾患に罹患している可能性はどれくらいでしょうか?それを疾患確率と言います。この場合は、0.5です。

Utilityユティリティ(効用)をNeumann PJらは次のように定義しています。“A utility is a measure of preference. In this context a utility is the measure of the preference or value that an individual or society places upon a particular health state. ” (Neumann PJ 2017) つまり、“特定の健康状態に個人または社会が置く好みまたは価値を測定した値”を効用と呼びます。値については、効用値という用語が用いられる場合もあります。また、個人の考える効用値は個人個人で異なり、個人の考える効用値と社会を代表する効用値は異なる場合もあります。なお、経済学では商品、サービスに対する好み(選好)を効用と言っています。

Expected Utility 期待効用と言う場合は、その健康状態が実現する前の時点で述べる場合の表現です。

図1. 無治療の場合の疾患確率と期待効用。

図1では、Uが期待効用を表しており、カッコ内にその条件を疾患の有無をD、治療またはアクションをAで表しています。例えば、U(D+A)は疾患Dがあり検査も治療も受けない場合の期待効用を表しています。

期待効用の大きさは0~1の値で表され、0は死亡、1は疾患が無く、検査も治療も受けない状態に対応します。したがって、U(DA)=1となります。

期待効用はある健康状態についてどれくらい価値があると思うかを0~1の数値で表したものということもできます。それぞれの価値観に基づく価値の大きさと言えます。

図1は、治療をしない場合の期待効用U(A)と疾患確率P(D+)の関係を決定木を用いて解析するためにExcelを用いて作成したものです。治療をしない場合の期待効用U(A)は枝の終末の期待効用の値にその枝の起きる確率を掛け算して総和を求めることで計算されます。下の方の式で示すように、U(DA)とU(D+A)を設定すると、その差の負の値を係数とし、U(DA)を切片とする疾患確率P(D+)の一次関数linear functionで、U(A)が計算されることが分かります。

疾患確率と期待効用は直線関係にあるということが分かります。

係数が負の値であるということは、疾患確率が高まるほど、期待効用が低下することを示しています。例えば、その疾患に罹患している人が100人いて、治療をしないで放置した場合、100人全員に疾患による望ましくないアウトカムが起き、U(D+A)で表される期待効用は1よりは小さな値になります。これは疾患確率P(D+)が1の場合に相当します。もし、その疾患に罹患していない人が100人いて、治療をしないで放置した場合、その疾患による影響は何もないので、疾患による望ましくないアウトカムは何も起きません。この場合の期待効用U(DA)は1で最大です。これは疾患確率P(D+)が0の場合に相当します。これらの二つの場合の中間で、100人中50人がその疾患に罹患している場合を考えてみましょう。治療をしないで、放置した場合、100人中50人には、疾患による望ましくないアウトカムが起き、U(DA)とU(D+A)の差の半分だけ期待効用の値は小さくなります。これは疾患確率P(D+)が0.5の場合に相当します。

これらをグラフで示すと、右下のグラフの様になります。横軸が疾患確率P(D+)、縦軸が効用値U(A)です。どちらの軸も0~1の範囲の値です。

P(D+)=0の場合、U(A)=U(DA)となります。そして、P(D+)=1の場合、U(A)=U(D+A)となります。これらの2点を直線で結ぶと、疾患確率P(D+)と治療しない場合の期待効用U(A)の関係が示されます。

図1および図2に関係する文献:

Neumann PJ, et al. ed. :Cost-Effectiveness in Health and Medicine. 2nd., 2017.

Pauker SG, Kassirer JP: The threshold approach to clinical decision making. N Engl J Med 1980;302:1109-17. doi: 10.1056/NEJM198005153022003 PMID: 7366635

Kassirer J, Wong J, Kopelman R: Learning Clinical Reasoning. 2nd Edition. 2010, Wolters Kluber, Lippincott, Williams & Wilkins, PA, USA.

Sox HC, Higgins M, Owens DK: Medical Decision Making (2nd ed.). 2013, Wiley-Blackwell.

Straus SE, Glasziou P, Richardson WS, Haynes RB: Evidence-Based Medicine: How to practice and teach EBM. (5th edition) . 2019, Elsevier, London, UK.  第5版

図2.治療する場合の疾患確率と期待効用。

図2は、治療する場合の期待効用U(A+)と疾患確率P(D+)の関係を決定木を用いて解析するためのものです。治療しない場合と同様に、疾患確率P(D+)の一次関数linear functionでU(A+)が計算され、両者の関係は、傾きがU(D+A+)とU(DA+)の差、U(DA+)を切片とする直線で表されます。

U(DA+)は疾患でないのに治療を受けることによる、害、負担、費用により決まります。これらにより、疾患に罹患していないにもかかわらず、効用値が低下します。

U(D+A+)は疾患があって、治療を受けることにより改善した期待効用値の値になります。

図3.治療閾値。

治療閾値Therapeutic thresholdとは、Kassirer J 2010のFigure 4.9の解説から引用すると: “疾患確率を0から1まで水平線で表している。治療閾値は、ある病気の可能性と、利用可能な治療法の益とリスクに関するデータから算出される。この閾値は、治療の基準(ベンチマーク)となるものである。閾値より低い疾患確率では治療を控え、閾値より高い疾患確率では治療が行われる。疾患確率をさらに評価するための追加検査がないことが前提である。そのような検査がない場合、この閾値が適用される。”

“治療閾値Rxは、疾患確率の推定値が、その値より小さければ、治療を控え、大きければ治療を行う値である。治療閾値はその治療法の益とリスクを記述しているデータから計算される”(Pauker SG 1980)。

Kassirer Jはリスクrisksという言葉を用いていますが、Sox HCらは害Harmという言葉を用いています。さらに、Sox HCらは単なる害ではなく、net harm すなわち正味の害と述べています。その意味するところは、疾患確率が1でない場合は、疾患でない者が1 – P(D+)の確率で含まれ、これらの人は本当は疾患ではないのに、治療を受けることになり、その治療によってもたらされる効果はすべてその治療の害として取り扱うということです。間違って、その治療を受けた場合、もし、その治療を受けない場合と比べて、望ましいことがもたらされた場合は、それは引き算した正味の害を用いるということです。しかし、ほとんどの場合、疾患がない場合に不必要な治療を受けることによる益はほとんど無いと言えるでしょう。

ここでは、コストという意味でCを用いています。治療を受けることでもたらされるすべての望ましくないアウトカムに置く価値の大きさとも言えますし、治療の望ましくないすべての効果に置く価値の大きさとも言えます。Kassirer JのリスクやSox HCのHarmと同じ意味です。

治療閾値は:

①疾患確率がその値を超えると治療をした場合の期待効用が治療をしない場合の期待効用を上回るので治療が行われる。

②その疾患に対するその治療法の属性であり、ベンチマークである。

③その治療法の益とコスト(害、負担、費用)から計算される。治療閾値Rx=C/(C+B)=1/(1+B/C)
C=U(DA) – U(DA+)     B=U(D+A+) – U(D+A)

④疾患確率をさらに評価する追加検査が無いことが前提である。

これらについて解説します。

①は当たり前ですね。すでに解説したように疾患確率と治療しない場合あるいは治療した場合の効用値は直線関係にあります。傾きが異なれば、どこかで、交差し、その左右では、どちらかの、つまり、治療しない場合か治療する場合の効用値の方がより大きくなります。なお、横軸が疾患確率で縦軸が効用値で、いずれも0~1の範囲です。

さて、②について考えてみましょう。治療閾値は、治療法の属性で、治療閾値が小さければコストが小さく、益が大きいことを示し、治療閾値が大きければ、コストが大きく、益が小さいこと示します。これは、③の計算式からわかります。

③については、どうでしょうか。Rx=1/(1+B/C)の式から、益と害の比によって治療閾値が決まることが分かります。比ですから、益と害の絶対的な大きさや、益と害の差が異なっていても、比であるB/Cが同じなら同じ治療閾値になります。例えば、B=0.5, C=0.2でもB=0.1, C=0.04でも治療閾値は0.2/(0.2+0.5)=0.04/(0.04+0.1)=0.28となります。この点はよく考える必要があります。正味の益を益から害を引き算した値で求めた場合、つまり正味の益net benefit=B-Cで計算すると、同じ治療閾値でも正味の益が大きい場合と小さい場合があるということになります。今の例でいうと、前者の正味の益0.3、後者の正味の益0.06で前者の方が明らかに大きくなります。正味の益の大きさが、治療開始すべきかどうかの決断に影響を与えるかどうかよく考える必要があります。

また、④も非常に重要です。もし、診断能が高い、すなわち感度・特異度の高い検査を施行して、陰性の結果が出た場合、疾患確率が低下し、治療閾値を下回ることが起き得ます。複数の診断法を実施する場合は、結果がどのような組み合わせになるか、Sox HC 2013の記述を引用すると、”gamble”です。検査結果が陰性で、疾患確率が低下した場合でも、治療閾値を超えていることを確認する必要があると思うのは正しい考え方です。それは、診断法の治療検査閾値Test-treatment thresholdによって知ることができます。これについては、後述する予定です。

実際の診療では、疾患確率が治療閾値を超えても、疾患でない割合、すなわち、1-P(D+)がどれくらいあるのかは、臨床決断に大きく影響します。患者の立場で、考えると、たとえ疾患確率が治療閾値を超えたとしても、本当はその疾患ではないのに、まちがって治療を受ける確率がどれくらいなら許容できるか考えさせてほしいということになるでしょう。Shared Decision Making 協働意思決定で疾患確率も議論の対象にせざるを得ない状況があると考えられます。

図3に関係する文献:

Kassirer J, Wong J, Kopelman R: Learning Clinical Reasoning. 2nd Edition. 2010, Wolters Kluwer, Lippincott, Williams & Wilkins, PA, USA.

Pauker SG, Kassirer JP: Therapeutic decision making: a cost-benefit analysis. N Engl J Med 1975;293:229-34. doi: 10.1056/NEJM197507312930505 PMID: 1143303

Sox HC, Higgins M, Owens DK: Medical Decision Making (2nd ed.). 2013, Wiley-Blackwell.

EBMのテキストブックにおける臨床決断の扱い

EBM(Evidence-Based Medicine)の教科書として、知らない人はいない、Straus SE, Glasziou P, Richardson WS, Haynes RB: Evidence-Based Medicine: How to practice and teach EBM. (5th edition) . 2019, Elsevier, London, UK. をもう一度読み直し、EBMと臨床決断との関係について考えてみました。

さて、EBM実践の5つのステップは図1に示す通りで、医療に携わっている人で知らない人はいないと思います。以前の投稿でも解説しました。

図1.EBM実践の5つのステップ。

”Step 1: 必要な情報を回答可能な質問に変換する”はPICO形式のクリニカルクエスチョンを作成すること、つまり、Population対象、Intervention介入、Comparator対照、Outcomeアウトカムの4つの項目を設定すると考えられているでしょう。しかし、アウトカムは重要なアウトカムをひとつ設定すればいいのでしょうか?臨床決断のためには、複数の益と害のアウトカムに対する介入の効果の大きさと確実性を分析する必要があります。益のアウトカムあるいは自分が疑問に思う、あるいは自分の興味あるアウトカムに対する効果だけを調べるだけでは、臨床決断に必要な情報は得られないかもしれないということになります。

このテキストブックでは、4章から6章まで以下の主題に関する研究論文を評価する際に、つまり”批判的吟味”を行う際に、①妥当か?②重要か?③適用可能か?の順に沿った枠組みで、評価することが述べられています。第4章では、臨床決断分析の研究論文や診療ガイドラインの批判的吟味についても述べられています。

4 Therapy: ランダム化比較試験、システマティックレビュー、臨床決断分析、医療経済分析、診療ガイドライン、n-of-1臨床試験

5 Diagnosis: 診断検査法、事前確率、複数の診断検査法、スクリーニング

6 Prognosis: 予後

7 Harm: 害

このステップは治療、診断、予後、害のいずれの場合も共通です(図2)。

図2.批判的吟味の共通のステップ。(Straus SE 2019に基づいて投稿者が作成)。

個別のランダム化比較試験についての記述では、3つのステップのそれぞれにおける評価項目が設定されています(図3)。その適用可能性の評価項目をみると、”われわれの患者がその治療により得られる可能性のある益と害は?”という項目があります。

図3.ランダム化比較試験(Randomized Controlled Trial, RCT)の各ステップの評価項目。(Straus SE 2019に基づいて投稿者が作成)。

批判的吟味の対象の研究論文に”益と害は何か?”、あるいは、益と害の大きさが直接記述されているわけではありません。益のアウトカム、害のアウトカムに対する介入の効果は記述されていて、それらを知ることはできるでしょう、しかし、それがそのまま益と害の大きさを表すわけではありません(Aler BS 2018, 2019)。また、一つのランダム化比較試験の研究論文では、すべての重要アウトカムに対する効果を知ることができない場合もあります。(比較効果研究Comprative Effectiveness Research, CERであれば、直接益と害の大きさの推定について、記述されているかもしれません。以前の投稿 および。)

ここでは、”われわれの患者が。。。”ですから、目の前の患者がその介入を実施した場合、どのような益と害を受けるのか?をその担当医が判断することを求めていると考えられます。Population-perspectiveの研究結果から、Individual-perspectiveの意思決定を行うということになります。しかし、その判断をどうやったらいいのでしょうか?しかも、Shared Decision Making(以前の投稿 を参照)のステップを踏んで、患者の価値観を聴いた上で、医療のセッティングを考慮した上で、決断Decision Making するということはどのようなことなのでしょうか?

本書の第4章には、臨床決断分析に関する部分がありますが、そこは臨床決断分析の研究論文の批判的吟味の手順についての記述であり、臨床決断はどのようにしたらいいのか?について書かれているわけではありませんので、そこを読んでも臨床決断の科学的な方法や、限界についてわかるようになるわけではありません。

ひとりひとりの患者さんは属性、価値観が異なり、同じ条件の人はまずいません。そのため、このようなテキストブックでは臨床決断を一般的な方法論として扱うことはできず、医師の裁量権の中で、個別に判断すべきという考えなのかもしれません。しかし、個別の臨床決断を論理的、科学的に行うにはどうしたらいいか?は極めて重要なテーマです。

また、診療ガイドラインでは推奨を作成する必要があるため、本来、決断分析が必要になるはずです。医療経済評価でもそうですし、医療政策もそうです。Elstein ASは2004年の時点で、これらのことを指摘しており、また、決断分析は医療界に広く受け入れられていないことをすでに指摘しています(Elstein AS 2004)。現在もあまり変わっていないように思えます。

診療ガイドラインでは、エビデンスの確実性だけでなく、益と害のバランス(正味の益)、Population-perspectiveとIndividual-perspective、強い推奨と弱い推奨、デシジョンエイド、などについて十分な理解が必要です。診療ガイドライン作成には、EBMの枠組みを超えた知識、スキルが必要です。

実臨床における臨床決断Medical Decision Making、協働意思決定Shared Decision Making 、そして診療ガイドライン作成Development of Clinical Practice GuidelineにはEBMのテキストブックではカバーされていない知識・スキル、すなわち少なくとも決断の科学Decision Scienceについて知る必要があると考えた方がいいようです。

本ブログでもいままで何回か決断分析について取り上げています。

  • Multi-Criteria Decision Analysis (MCDA)
  • Multi-Criteria Decision Analysis (MCDA)のステップ
  • Keeney and RaiffaのSwing weightingを用いたMCDA
  • Swing weightingを用いたMCDAの結果
  • EMAのBenefit-risk methodology
  • FDAのBenefit-Risk Assessment Framework 
  • FDAのBenefit-Risk Assessment(続き) 

文献:
Alper BS, Ehrlich A, Oettgen P: 6 putting it all together: from net effect estimate to the certainty of net benefit.  BMJ Evidence-Based Medicine 2018;23(Supplement 1):
http://dx.doi.org/10.1136/bmjebm-2018-111024.6

Alper BSはウェブツールとしてNet Effect Calculatorを公開しています(EBSCO Health DynaMed Pus)。

Alper BS, Oettgen P, Kunnamo I, Iorio A, Ansari MT, Murad MH, Meerpohl JJ, Qaseem A, Hultcrantz M, Schünemann HJ, Guyatt G, GRADE Working Group: Defining certainty of net benefit: a GRADE concept paper. BMJ Open 2019;9:e027445. doi: 10.1136/bmjopen-2018-027445 PMID: 31167868

Elstein AS: On the origins and development of evidence-based medicine and medical decision making. Inflamm Res 2004;53 Suppl 2:S184-9. doi: 10.1007/s00011-004-0357-2 PMID: 15338074

Gail MH, Costantino JP, Bryant J, Croyle R, Freedman L, Helzlsouer K, Vogel V: Weighing the risks and benefits of tamoxifen treatment for preventing breast cancer. J Natl Cancer Inst 1999;91:1829-46. PMID: 10547390

———————————————-
Alper BSはNet Effect Calculatorを公開しています(文献欄にリンクしてあります)。これは、二値変数アウトカムの場合、Gail/NCIの方法(Gail MH 1999)に準じているようで、Net effect正味の効果の点推定値とその信頼区間が算出されます。ただし、各アウトカムに対する効果の間に相関がある場合は、適用できないことになっています。

正味の効果とは、各アウトカムの重要性を設定し、それぞれのアウトカムに対する効果の大きさを最重要アウトカムの値に調整して、複数のアウトカムに対する効果の総和を算出したものです。例えば、最重要アウトカムの重要性が1.0でリスク差が100人に-10人、重要性を0.5に設定したアウトカムのリスク差が100人に4人の場合、後者は100人に4×0.5=2人分とみなして、総和を計算します。前者が、有害事象が減少する場合で、マイナスの値、後者が有害事象が増える場合でプラスの値、とすると、この例では、正味の効果は100人で-8人となります。さらに95%信頼区間の下限値と上限値を設定しますが、この二つの値は、点推定値に対して対称になります。正味の効果推定値は正規分布に従うことを前提としており、その分布の標準偏差SDと正味の効果の推定値の95%信頼区間の値が算出されます。(なおGail/NCIの方法では正味の益が増える場合にプラスの値になるよう計算する点で相違があります。)

臨床的エキスパティーズとEBM

Evidence-Based Medicine (EBM)におけるClinical Expertise 臨床的専門能力あるいは臨床的エキスパティーズについて、Haynesらのこのような図を見たことがある人は多いと思います。EBMはエビデンスだけで意思決定を行い、医療を行うのではないことを解説する文脈で用いられていることが多いと思います。

図1.EBMにおける臨床的エキスパティーズのモデル。

さて、科学的エビデンスだけではなく、臨床的状態・状況、患者の好み(価値観)と行動に臨床的エキスパティーズを統合して医療が行われると単純な理解でいいでしょうか?Wieten Sが2018年に発表した論文で深い考察をしているので、紹介します。

図2.3つのモデル。

モデル①: 「EBMは、臨床決断において、1.直感、2.系統的でない臨床経験、3.病態生理学的理論的根拠を重要視せず、臨床研究からのエビデンスの調査を強調している」。このような考え方から、モデル①が生まれた。ここで示されている、エビデンスピラミッドの層はひとつの例であるが、このようなエビデンスピラミッドのいずれの場合も、最低レベルは背景情報または臨床的エキスパティーズになっている。専門家の意見をエビデンス内に含め、それを一番下位に位置付ける考え方である。Wieten Sによれば、GRADEアプローチは専門家の経験(に基づくデータ)はエビデンスのひとつとみなし、エビデンスの評価に必要な専門家の判断・意見はエビデンスの外側に位置付けている。

モデル②:「個人の臨床的エキスパティーズは、臨床家個人が臨床経験、臨床実践を通じて、獲得した熟練と判断を意味する。エキスパティーズの向上は様々な面に反映されるが、特に、効果的で効率的な診断と、患者に対する臨床決断における患者の苦悩、権利、好みのより思慮深い同定とより共感的使用に反映される」。この記述から作成されたのがモデル②の図である。モデル②では、エキスパティーズをエビデンスから分離しており、モデル①とその点で異なる。最善の外的エビデンス、患者の価値観と期待、個人の臨床的エキスパティーズのVennダイアグラムの3要素が重なったところにEBMが置かれている。

モデル③:患者の好みと行動、研究エビデンス、臨床状態と状況の3つの要素の中央に臨床的エキスパティーズが置かれている。(これが最初に図1に示したものです。)臨床的エキスパティーズは臨床的スキルだけでなく、患者の臨床状態と臨床状況と研究エビデンス・患者の好みや行動すべてのバランスをとる能力も含まれる。研究エビデンスを解釈し、状況に対応して、様々なトレードオフを仕分け、その患者に最善の医療を実行するために、臨床的スキルを獲得し、研ぎ澄ますことが求められる。患者とのコミュニケーションが重要であり、患者の希望、好み(価値観)を確認しながら、情報を得たうえでの選択ができるように、患者の必要とする情報を提示することが今まで以上に求められている。

臨床的エキスパティーズはエビデンスの一部を占めることもあるが、大部分はエビデンスの外側にある。臨床的エキスパティーズは、診断、予後判定、効果的な患者とのコミュニケーション、正しい治療や診断の実行、ポピュレーションに基づくエビデンスを特定の個人としての患者へ適用することを含む。そして、患者の好みと行動、研究エビデンス、臨床状態と状況の3つの要素をまとめる力である。

これら3つのモデルは、互いに排他的なものではなく、それぞれに臨床に有用な情報を含んでいる。

Wieten Sは、さらに、エキスパティーズとは何かについて、哲学的考察を行っており、「考えなくても、連続して熟練した作業ができることflow of skilled coping」(Hubert Dreyfus)、「社会的に認知された政治的パワーをもつ専門的能力」(Stephan Turner)(GOBSAT Good Old Boys Sit Around A Tableのようなもの)、「統計学的予測ルールなどを用いないで直観力による判断ができること」Michael Bishop & JD Trout)、「その分野を熟知しており独自の貢献ができること(contributory expertise)または独自の貢献はできないがその分野の言語をマスターしていること(interactional expertise)」(Harry Collins & Robert Evans)について解説している。

さて、モデル③について自分の追加的考察を述べておきます。研究エビデンスを正しく理解していても、臨床的スキルが無ければ、介入を実行することはできないということは明白です。すべての医療はその医療者のコンピテンシー=臨床的エキスパティーズ+αを通じて実現することは否定のしようがありません。例えば、内視鏡的に治療可能な早期胃癌で、5年生存率は95%以上だと分かっていても、ESD Endoscopic Submucosal Dissectionができなければ、その医療は実現できません。また、委託可能なレベルでESDが出来るようになるにはどうしたらいいかは臨床研修の課題になります。

患者の好みと行動、研究エビデンス、臨床状態と状況の3つの要素から、実際の医療を実現できるかどうかは、臨床的エキスパティーズによって決まってきます。そして、EBMのステップ2,3のエビデンスの検索と批判的吟味は臨床的エキスパティーズの一部でしかありませんし(以前の投稿参照)、EBMのステップ4の患者への適用には深い理解と科学的・論理的深い思考が必要です。特に、エビデンスの検索と批判的吟味はシステマティックに行わないと、ひとつの論文の批判的吟味だけでは間違った結論に到達するリスクがあります。Shared Decision Making協働意思決定の能力も臨床的エキスパティーズに含まれます。

臨床決断Clinical Decision MakingあるいはMedical Decision Makingを科学的・論理的に行う能力は臨床的エキスパティーズに含まれることは明白ですが、決断の科学Decision Science、たとえばMulti-Criteria Decision Analysis (MCDA)などの知識・スキルが必要になり、これらは少なくともわが国では通常のEBMの教育コンテンツが十分カバーしているとはいいがたい状況です。EBMが臨床的エキスパティーズを包含しているというより、臨床的エキスパティーズがEBMのコンピテンシーを包含していると考えるべきですし、実際の医療も臨床研修もそのような構造で行われています。

EBMは学問の体系ではなく、医療実践の体系で、EBMのコンピテンシーは実践のために個人レベルで必要な知識、スキル(技能)、態度、価値観のことです。

Wieten Sの論文を熟読した上で、自分でも熟考することをお勧めします。

文献:

Wieten S: Expertise in evidence-based medicine: a tale of three models. Philos Ethics Humanit Med 2018;13:2. doi: 10.1186/s13010-018-0055-2 PMID: 29394938

Haynes RB, Devereaux PJ, Guyatt GH: Physicians’ and patients’ choices in evidence based practice. BMJ 2002;324:1350. doi: 10.1136/bmj.324.7350.1350 PMID: 12052789

Sackett DL, Rosenberg WM, Gray JA, Haynes RB, Richardson WS: Evidence based medicine: what it is and what it isn’t. BMJ 1996;312:71-2. doi: 10.1136/bmj.312.7023.71 PMID: 8555924

Evidence-Based Medicine Working Group: Evidence-based medicine. A new approach to teaching the practice of medicine. JAMA 1992;268:2420-5. doi: 10.1001/jama.1992.03490170092032 PMID: 1404801

Synthesis without meta-analysis (SWiM)について

Campbell Mらの提唱する、メタアナリシスのないエビデンスの統合方法について要点をまとめてみました。以下の9項目のチェックリストが提案されており、これらの項目を記述することが求められています。

1.統合のための研究のグループ化 Grouping studies for synthesis

介入、対象、アウトカム、研究デザインなど、統合に用いた研究のグループ化の際の基準項目の記述とその理論的根拠を記述する。特に、RCTに限定するわけではないので、さまざまな点で違いがある研究を統合する必要があり、研究をグループ化する際の基準項目を説明することが求められる。

介入のアウトカムへの影響に対する理論(Theory)や理論的根拠rationaleを述べる、あるいは引用する。

2.標準化した効果指標と用いられた変換方法Describe the standardised metric and transformation methods used

リスク比、オッズ比、リスク差、平均値差、標準化平均値差、平均値比、効果の方向、あるいはP値などのいずれかを用い、共通の指標で効果の大きさを提示する。オッズ比から標準化平均値差へ変換するなど、変換が必要な場合は、その方法を記述する(Cochrane handbook 第6章参照)。

3.統合の方法 Describe the synthesis methods

メタアナリシスができない場合、代替として用いた統合の方法を記述し、その正当性を述べる。P値を結合する、中央値と中央四分位などまとめ値を提示する、効果の方向について投票結果を提示するなど(Cochrane handbook 12章参照)。

4.まとめと統合のために優先的に用いた研究結果の選択基準 Criteria used to prioritise results for summary and synthesis

研究デザイン、バイアスリスク、非直接性、サンプルサイズなど、研究選択の基準を記述し、正当性を説明する。事前に基準を設定した場合はそれを記述するが、文献検索後に変更が必要になった場合は、それを記述する。

5.報告されている効果の異質性の調査 Investigation of heterogeneity in reported effects

異質性を調べた方法を記述する。メタアナリシスによる亜群分析、メタリグレッションができないので、研究間の異質性を、表やグラフで示し、そのような方法を用いた理由を記述する。

6.エビデンスの確実性 Certainty of evidence

統合した知見の確実性を評価するのに用いた方法を記述する。統合した知見の精確性(可能であれば信頼区間など)、研究数、参加者数、研究間の効果の非一貫性、各研究のバイアスリスク、非直接性、出版バイアスなど。投票の結果を提示することもある。

7.データの提示方法 Data presentation methods

表、グラフ(フォレストプロット、ハーベストプロット、箱ひげ図、効果方向プロット、アルバトロスプロット、バブルプロットなど)とそれらの解説。研究を等級づけた場合の基準項目など。

8.結果の報告 Reporting results

それぞれの比較とアウトカムに対して、統合された知見、その確実性を記述する。クリニカルクエスチョンに対応する結果を記述し、貢献度の大きな研究について説明する。

含めた研究の重要な特徴や、可能であれば、信頼区間、確実性の評価の結果などを記述する。

異質性の調査の結果を記述する。事前に予定した手法を変更した場合は、それを理由とともに記述する。

9.統合の限界 Limitations of the synthesis

統合に用いた方法やグループ化に用いた方法の限界を記述し、得られた結論への影響をオリジナルのリサーチクエスチョンと関連付けて記述する。

統合方法の限界について報告する際には、標準化した効果指標、用いた統合の方法、統合するために必要だった研究のグルーピングの再構成について記述する。

効果の方向、あるいはそれに関する投票を効果指標(metric)として用いた場合、“介入の効果の平均はどれくらいか?”よりも“効果を示す何らかのエビデンスがあるか?”というクエスチョンが適切である。(ランダム効果モデルのメタアナリシスの場合と同様)。

エビデンスが限られていたり、アウトカムや効果推定値の報告が不完全であったりしために、初期の分析プロトコールを変更せざるを得なかった場合、それによる限界を報告すること。

ーーーーーーー

メタアナリシスができない、あるいは含まないシステマティックレビュー(SR)については、論文報告の方法や形式に差があり、スタンダードの必要性が主張されてきた。また、従来、Narrative synthesis, Qualitative synthesis, Synthesis without meta-analysis、定性的システマティックレビュー、質的統合、定性的統合などさまざま用語が用いられてきたが、ほぼ同じ意味で用いられてきた。ただし、質的研究Qualitative Researchのシステマティックレビューという意味ではないので、注意が必要である。

SWiMはPRISMA、RAMESESなどを発展させたもので、開発方法もフォーマルな公正さ、透明性を確保する方法が用いられている。SWiMによれば、効果のmetricすなわち効果指標として、たとえばリスクが低下するがその正確な程度はわからないような場合、すなわち「定性的には効果がある」と言えるような場合、介入の効果の方向性についてエビデンスを統合することや、投票結果を用いることまで、方法として含めており、全体として非常に柔軟性の高い方法といえる。

文献:
Campbell M, McKenzie JE, Sowden A, Katikireddi SV, Brennan SE, Ellis S, Hartmann-Boyce J, Ryan R, Shepperd S, Thomas J, Welch V, Thomson H: Synthesis without meta-analysis (SWiM) in systematic reviews: reporting guideline. BMJ 2020;368:l6890. doi: 10.1136/bmj.l6890 PMID: 31948937