疾患確率-ベースラインリスク-治療閾値

ベースラインリスクがどれくらい高かったら治療を開始すべきか?についてDjulbegovic Bらのアプローチを前投稿で紹介しました。彼らの方法では、疾患確率を1.0に設定して、ベースラインリスクの値を変動させた場合に、益が害を上回るベースラインリスクの値を算出します。

別の観点から見ると、疾患確率とベースラインリスクのふたつの変数によって益と害の大きさが決まり、益の大きさが害を上回る疾患確率の値と、ベースラインリスクの値が治療閾値になるということになります。Djulbegovic Bらの論文の例に対して、疾患確率とベースラインリスクの両者を含む決定木Decision treeを作成してみました(図1)。

図1.疾患確率とベースラインリスクによる治療閾値を計算するための決定木。上段が治療しない場合、下段が治療する場合。

この決定木は治療を選択した後、P(D+)の確率で疾患が起き、その後VTE再発、出血、無症状の枝に分かれ、それぞれが図中に示す確率で起きることをモデル化しています。こうすることで、疾患確率=P(D+)とベースラインリスク=VTE再発確率Pn(O1)の二つの変数を変動させた場合の効用値を治療しない場合と治療する場合で比較することができるようになります。

この決定木に基づいて、治療閾値を計算する方法を図2に示します。VTE再発が治療によりリスク比(RR)0.188で抑制され、一方で出血の副作用が治療により4.8%起きます。期待効用は何も起きない場合を1.0とし、VTE再発は0.3、出血は0.3とし、これら二つのアウトカムの重要性(Values)は1:1、すなわちRVHを1に設定してあります。

図中の疾患確率に基づく治療閾値はベースラインの値を固定して、疾患確率を変動させることで、また、アウトカムの発生確率に基づく治療閾値は疾患確率を1に固定して、ベースラインリスクを変動させることで、計算しています。

図2.治療閾値の計算。

図2の右下にアウトカムの発生確率に基づく、すなわち、ベースラインリスクがいくつになれば益が害を上回るかを示していますが、0.05911と前回と同じ値が得られています。

通常の決定木Decision treeのモデルは今回示したものだと思いますし、このモデルの方が理解が容易だと思います。

Excelのシートのサイズが大きく、式も多いので、詳細はこちらからファイルをダウンロードして見てください。Download

文献:

Djulbegovic B, Hozo I, Mayrhofer T, van den Ende J, Guyatt G: The threshold model revisited. J Eval Clin Pract 2019;25:186-195. doi: 10.1111/jep.13091 PMID: 30575227

ベースラインリスクと治療閾値

アウトカムが起きる確率がどれくらいになったら治療をすべきか?すなわち、ベースラインリスクがどれくらい高かったら治療を開始すべきか?についてDjulbegovic Bらは図1のような方法を提示しています。

図1. ベースラインリスクと治療閾値。

文献:Djulbegovic B, Hozo I, Mayrhofer T, van den Ende J, Guyatt G: The threshold model revisited. J Eval Clin Pract 2019;25:186-195. doi: 10.1111/jep.13091 PMID: 30575227

この例では、静脈血栓塞栓症(Venous thromboembolism, VTE)の患者で原疾患の診断が確定している、すなわち疾患確率p=1に設定し、アウトカムVTEの再発の確率、すなわちベースラインリスクが0~1まで変動させた場合に、抗凝固薬rivaroxaban投与を開始すべき値の求め方を述べています。益のアウトカムはVTE再発でそれの抑制が望ましい効果になり、プラセボで0.071の確率で起きるのに対して、投薬によりリスク比0.188、相対リスク減少RRR0.812の効果が得られます。害のアウトカムである出血事象の起きる確率Hrxは0.048で、プラセボでは0に設定しています。図1の中で、RVHは害のアウトカムの重要性を益のアウトカムに対して何倍とみなすか?すなわち患者の価値観によって設定する値で、この例では1に設定していますが、もし、出血事象がVTE再発に比べて2倍重要と考えるなら2、半分と考えるなら0.5に設定します。

アウトカムの発生確率の、すなわちベースラインリスクの治療閾値はRVH*Hrx/RRRで算出され、この例では、0.059になります。グラフで示すと図2の様になります。

図2.ベースラインリスクと期待効用による治療閾値。青はU(A-)すなわちプラセボ、オレンジはU(A+)すなわち抗凝固薬投与の場合を示します。

Djulbegovic Bらは、疾患確率とアウトカムの起きる確率と二重にカウントすることを避けるため、図1のように疾患確率を1に設定すると説明しています。実は、この点については、疾患確率とアウトカムの起きる確率の両方を取り込んだDecision treeを作成することによって解決できます。次回それについて解説しようと思います。

治療閾値は益と害(Benefit and harm)あるいは益とコスト(Benefit and cost)、さらにその比B/HあるいはB/Cで決まりますが、治療閾値を超えた疾患確率あるいはアウトカムの起きる確率ではB>Hとなりますが、BとHの差、すなわち正味の益Net benefitは疾患確率あるいはアウトカムの起きる確率が高くなるほど大きくなります。治療閾値はそれを超えたら治療をしてもいい値ですが、疾患確率の場合は、益を最大化するには、何らかの診断法を実施して疾患確率を高くしてから治療を開始すべきと考えられますし、実臨床ではそれが実行されていると思います。

治療閾値Treatment threshold

治療閾値について理解するためには、期待効用、疾患確率についての知識が必要になります。

疾患確率は、その人が想定する疾患に罹患している確率です。ここではP(D+)で表しています。確率ですから、0~1の値を取ります。100人の人がいて、その内の50人がある疾患に罹患しているとします。その100人の中から、1人が特別な理由なく、やってきました。その人がその疾患に罹患している可能性はどれくらいでしょうか?それを疾患確率と言います。この場合は、0.5です。

Utilityユティリティ(効用)をNeumann PJらは次のように定義しています。“A utility is a measure of preference. In this context a utility is the measure of the preference or value that an individual or society places upon a particular health state. ” (Neumann PJ 2017) つまり、“特定の健康状態に個人または社会が置く好みまたは価値を測定した値”を効用と呼びます。値については、効用値という用語が用いられる場合もあります。また、個人の考える効用値は個人個人で異なり、個人の考える効用値と社会を代表する効用値は異なる場合もあります。なお、経済学では商品、サービスに対する好み(選好)を効用と言っています。

Expected Utility 期待効用と言う場合は、その健康状態が実現する前の時点で述べる場合の表現です。

図1. 無治療の場合の疾患確率と期待効用。

図1では、Uが期待効用を表しており、カッコ内にその条件を疾患の有無をD、治療またはアクションをAで表しています。例えば、U(D+A)は疾患Dがあり検査も治療も受けない場合の期待効用を表しています。

期待効用の大きさは0~1の値で表され、0は死亡、1は疾患が無く、検査も治療も受けない状態に対応します。したがって、U(DA)=1となります。

期待効用はある健康状態についてどれくらい価値があると思うかを0~1の数値で表したものということもできます。それぞれの価値観に基づく価値の大きさと言えます。

図1は、治療をしない場合の期待効用U(A)と疾患確率P(D+)の関係を決定木を用いて解析するためにExcelを用いて作成したものです。治療をしない場合の期待効用U(A)は枝の終末の期待効用の値にその枝の起きる確率を掛け算して総和を求めることで計算されます。下の方の式で示すように、U(DA)とU(D+A)を設定すると、その差の負の値を係数とし、U(DA)を切片とする疾患確率P(D+)の一次関数linear functionで、U(A)が計算されることが分かります。

疾患確率と期待効用は直線関係にあるということが分かります。

係数が負の値であるということは、疾患確率が高まるほど、期待効用が低下することを示しています。例えば、その疾患に罹患している人が100人いて、治療をしないで放置した場合、100人全員に疾患による望ましくないアウトカムが起き、U(D+A)で表される期待効用は1よりは小さな値になります。これは疾患確率P(D+)が1の場合に相当します。もし、その疾患に罹患していない人が100人いて、治療をしないで放置した場合、その疾患による影響は何もないので、疾患による望ましくないアウトカムは何も起きません。この場合の期待効用U(DA)は1で最大です。これは疾患確率P(D+)が0の場合に相当します。これらの二つの場合の中間で、100人中50人がその疾患に罹患している場合を考えてみましょう。治療をしないで、放置した場合、100人中50人には、疾患による望ましくないアウトカムが起き、U(DA)とU(D+A)の差の半分だけ期待効用の値は小さくなります。これは疾患確率P(D+)が0.5の場合に相当します。

これらをグラフで示すと、右下のグラフの様になります。横軸が疾患確率P(D+)、縦軸が効用値U(A)です。どちらの軸も0~1の範囲の値です。

P(D+)=0の場合、U(A)=U(DA)となります。そして、P(D+)=1の場合、U(A)=U(D+A)となります。これらの2点を直線で結ぶと、疾患確率P(D+)と治療しない場合の期待効用U(A)の関係が示されます。

図1および図2に関係する文献:

Neumann PJ, et al. ed. :Cost-Effectiveness in Health and Medicine. 2nd., 2017.

Pauker SG, Kassirer JP: The threshold approach to clinical decision making. N Engl J Med 1980;302:1109-17. doi: 10.1056/NEJM198005153022003 PMID: 7366635

Kassirer J, Wong J, Kopelman R: Learning Clinical Reasoning. 2nd Edition. 2010, Wolters Kluber, Lippincott, Williams & Wilkins, PA, USA.

Sox HC, Higgins M, Owens DK: Medical Decision Making (2nd ed.). 2013, Wiley-Blackwell.

Straus SE, Glasziou P, Richardson WS, Haynes RB: Evidence-Based Medicine: How to practice and teach EBM. (5th edition) . 2019, Elsevier, London, UK.  第5版

図2.治療する場合の疾患確率と期待効用。

図2は、治療する場合の期待効用U(A+)と疾患確率P(D+)の関係を決定木を用いて解析するためのものです。治療しない場合と同様に、疾患確率P(D+)の一次関数linear functionでU(A+)が計算され、両者の関係は、傾きがU(D+A+)とU(DA+)の差、U(DA+)を切片とする直線で表されます。

U(DA+)は疾患でないのに治療を受けることによる、害、負担、費用により決まります。これらにより、疾患に罹患していないにもかかわらず、効用値が低下します。

U(D+A+)は疾患があって、治療を受けることにより改善した期待効用値の値になります。

図3.治療閾値。

治療閾値Therapeutic thresholdとは、Kassirer J 2010のFigure 4.9の解説から引用すると: “疾患確率を0から1まで水平線で表している。治療閾値は、ある病気の可能性と、利用可能な治療法の益とリスクに関するデータから算出される。この閾値は、治療の基準(ベンチマーク)となるものである。閾値より低い疾患確率では治療を控え、閾値より高い疾患確率では治療が行われる。疾患確率をさらに評価するための追加検査がないことが前提である。そのような検査がない場合、この閾値が適用される。”

“治療閾値Rxは、疾患確率の推定値が、その値より小さければ、治療を控え、大きければ治療を行う値である。治療閾値はその治療法の益とリスクを記述しているデータから計算される”(Pauker SG 1980)。

Kassirer Jはリスクrisksという言葉を用いていますが、Sox HCらは害Harmという言葉を用いています。さらに、Sox HCらは単なる害ではなく、net harm すなわち正味の害と述べています。その意味するところは、疾患確率が1でない場合は、疾患でない者が1 – P(D+)の確率で含まれ、これらの人は本当は疾患ではないのに、治療を受けることになり、その治療によってもたらされる効果はすべてその治療の害として取り扱うということです。間違って、その治療を受けた場合、もし、その治療を受けない場合と比べて、望ましいことがもたらされた場合は、それは引き算した正味の害を用いるということです。しかし、ほとんどの場合、疾患がない場合に不必要な治療を受けることによる益はほとんど無いと言えるでしょう。

ここでは、コストという意味でCを用いています。治療を受けることでもたらされるすべての望ましくないアウトカムに置く価値の大きさとも言えますし、治療の望ましくないすべての効果に置く価値の大きさとも言えます。Kassirer JのリスクやSox HCのHarmと同じ意味です。

治療閾値は:

①疾患確率がその値を超えると治療をした場合の期待効用が治療をしない場合の期待効用を上回るので治療が行われる。

②その疾患に対するその治療法の属性であり、ベンチマークである。

③その治療法の益とコスト(害、負担、費用)から計算される。治療閾値Rx=C/(C+B)=1/(1+B/C)
C=U(DA) – U(DA+)     B=U(D+A+) – U(D+A)

④疾患確率をさらに評価する追加検査が無いことが前提である。

これらについて解説します。

①は当たり前ですね。すでに解説したように疾患確率と治療しない場合あるいは治療した場合の効用値は直線関係にあります。傾きが異なれば、どこかで、交差し、その左右では、どちらかの、つまり、治療しない場合か治療する場合の効用値の方がより大きくなります。なお、横軸が疾患確率で縦軸が効用値で、いずれも0~1の範囲です。

さて、②について考えてみましょう。治療閾値は、治療法の属性で、治療閾値が小さければコストが小さく、益が大きいことを示し、治療閾値が大きければ、コストが大きく、益が小さいこと示します。これは、③の計算式からわかります。

③については、どうでしょうか。Rx=1/(1+B/C)の式から、益と害の比によって治療閾値が決まることが分かります。比ですから、益と害の絶対的な大きさや、益と害の差が異なっていても、比であるB/Cが同じなら同じ治療閾値になります。例えば、B=0.5, C=0.2でもB=0.1, C=0.04でも治療閾値は0.2/(0.2+0.5)=0.04/(0.04+0.1)=0.28となります。この点はよく考える必要があります。正味の益を益から害を引き算した値で求めた場合、つまり正味の益net benefit=B-Cで計算すると、同じ治療閾値でも正味の益が大きい場合と小さい場合があるということになります。今の例でいうと、前者の正味の益0.3、後者の正味の益0.06で前者の方が明らかに大きくなります。正味の益の大きさが、治療開始すべきかどうかの決断に影響を与えるかどうかよく考える必要があります。

また、④も非常に重要です。もし、診断能が高い、すなわち感度・特異度の高い検査を施行して、陰性の結果が出た場合、疾患確率が低下し、治療閾値を下回ることが起き得ます。複数の診断法を実施する場合は、結果がどのような組み合わせになるか、Sox HC 2013の記述を引用すると、”gamble”です。検査結果が陰性で、疾患確率が低下した場合でも、治療閾値を超えていることを確認する必要があると思うのは正しい考え方です。それは、診断法の治療検査閾値Test-treatment thresholdによって知ることができます。これについては、後述する予定です。

実際の診療では、疾患確率が治療閾値を超えても、疾患でない割合、すなわち、1-P(D+)がどれくらいあるのかは、臨床決断に大きく影響します。患者の立場で、考えると、たとえ疾患確率が治療閾値を超えたとしても、本当はその疾患ではないのに、まちがって治療を受ける確率がどれくらいなら許容できるか考えさせてほしいということになるでしょう。Shared Decision Making 協働意思決定で疾患確率も議論の対象にせざるを得ない状況があると考えられます。

図3に関係する文献:

Kassirer J, Wong J, Kopelman R: Learning Clinical Reasoning. 2nd Edition. 2010, Wolters Kluwer, Lippincott, Williams & Wilkins, PA, USA.

Pauker SG, Kassirer JP: Therapeutic decision making: a cost-benefit analysis. N Engl J Med 1975;293:229-34. doi: 10.1056/NEJM197507312930505 PMID: 1143303

Sox HC, Higgins M, Owens DK: Medical Decision Making (2nd ed.). 2013, Wiley-Blackwell.

EBMのテキストブックにおける臨床決断の扱い

EBM(Evidence-Based Medicine)の教科書として、知らない人はいない、Straus SE, Glasziou P, Richardson WS, Haynes RB: Evidence-Based Medicine: How to practice and teach EBM. (5th edition) . 2019, Elsevier, London, UK. をもう一度読み直し、EBMと臨床決断との関係について考えてみました。

さて、EBM実践の5つのステップは図1に示す通りで、医療に携わっている人で知らない人はいないと思います。以前の投稿でも解説しました。

図1.EBM実践の5つのステップ。

”Step 1: 必要な情報を回答可能な質問に変換する”はPICO形式のクリニカルクエスチョンを作成すること、つまり、Population対象、Intervention介入、Comparator対照、Outcomeアウトカムの4つの項目を設定すると考えられているでしょう。しかし、アウトカムは重要なアウトカムをひとつ設定すればいいのでしょうか?臨床決断のためには、複数の益と害のアウトカムに対する介入の効果の大きさと確実性を分析する必要があります。益のアウトカムあるいは自分が疑問に思う、あるいは自分の興味あるアウトカムに対する効果だけを調べるだけでは、臨床決断に必要な情報は得られないかもしれないということになります。

このテキストブックでは、4章から6章まで以下の主題に関する研究論文を評価する際に、つまり”批判的吟味”を行う際に、①妥当か?②重要か?③適用可能か?の順に沿った枠組みで、評価することが述べられています。第4章では、臨床決断分析の研究論文や診療ガイドラインの批判的吟味についても述べられています。

4 Therapy: ランダム化比較試験、システマティックレビュー、臨床決断分析、医療経済分析、診療ガイドライン、n-of-1臨床試験

5 Diagnosis: 診断検査法、事前確率、複数の診断検査法、スクリーニング

6 Prognosis: 予後

7 Harm: 害

このステップは治療、診断、予後、害のいずれの場合も共通です(図2)。

図2.批判的吟味の共通のステップ。(Straus SE 2019に基づいて投稿者が作成)。

個別のランダム化比較試験についての記述では、3つのステップのそれぞれにおける評価項目が設定されています(図3)。その適用可能性の評価項目をみると、”われわれの患者がその治療により得られる可能性のある益と害は?”という項目があります。

図3.ランダム化比較試験(Randomized Controlled Trial, RCT)の各ステップの評価項目。(Straus SE 2019に基づいて投稿者が作成)。

批判的吟味の対象の研究論文に”益と害は何か?”、あるいは、益と害の大きさが直接記述されているわけではありません。益のアウトカム、害のアウトカムに対する介入の効果は記述されていて、それらを知ることはできるでしょう、しかし、それがそのまま益と害の大きさを表すわけではありません(Aler BS 2018, 2019)。また、一つのランダム化比較試験の研究論文では、すべての重要アウトカムに対する効果を知ることができない場合もあります。(比較効果研究Comprative Effectiveness Research, CERであれば、直接益と害の大きさの推定について、記述されているかもしれません。以前の投稿 および。)

ここでは、”われわれの患者が。。。”ですから、目の前の患者がその介入を実施した場合、どのような益と害を受けるのか?をその担当医が判断することを求めていると考えられます。Population-perspectiveの研究結果から、Individual-perspectiveの意思決定を行うということになります。しかし、その判断をどうやったらいいのでしょうか?しかも、Shared Decision Making(以前の投稿 を参照)のステップを踏んで、患者の価値観を聴いた上で、医療のセッティングを考慮した上で、決断Decision Making するということはどのようなことなのでしょうか?

本書の第4章には、臨床決断分析に関する部分がありますが、そこは臨床決断分析の研究論文の批判的吟味の手順についての記述であり、臨床決断はどのようにしたらいいのか?について書かれているわけではありませんので、そこを読んでも臨床決断の科学的な方法や、限界についてわかるようになるわけではありません。

ひとりひとりの患者さんは属性、価値観が異なり、同じ条件の人はまずいません。そのため、このようなテキストブックでは臨床決断を一般的な方法論として扱うことはできず、医師の裁量権の中で、個別に判断すべきという考えなのかもしれません。しかし、個別の臨床決断を論理的、科学的に行うにはどうしたらいいか?は極めて重要なテーマです。

また、診療ガイドラインでは推奨を作成する必要があるため、本来、決断分析が必要になるはずです。医療経済評価でもそうですし、医療政策もそうです。Elstein ASは2004年の時点で、これらのことを指摘しており、また、決断分析は医療界に広く受け入れられていないことをすでに指摘しています(Elstein AS 2004)。現在もあまり変わっていないように思えます。

診療ガイドラインでは、エビデンスの確実性だけでなく、益と害のバランス(正味の益)、Population-perspectiveとIndividual-perspective、強い推奨と弱い推奨、デシジョンエイド、などについて十分な理解が必要です。診療ガイドライン作成には、EBMの枠組みを超えた知識、スキルが必要です。

実臨床における臨床決断Medical Decision Making、協働意思決定Shared Decision Making 、そして診療ガイドライン作成Development of Clinical Practice GuidelineにはEBMのテキストブックではカバーされていない知識・スキル、すなわち少なくとも決断の科学Decision Scienceについて知る必要があると考えた方がいいようです。

本ブログでもいままで何回か決断分析について取り上げています。

  • Multi-Criteria Decision Analysis (MCDA)
  • Multi-Criteria Decision Analysis (MCDA)のステップ
  • Keeney and RaiffaのSwing weightingを用いたMCDA
  • Swing weightingを用いたMCDAの結果
  • EMAのBenefit-risk methodology
  • FDAのBenefit-Risk Assessment Framework 
  • FDAのBenefit-Risk Assessment(続き) 

文献:
Alper BS, Ehrlich A, Oettgen P: 6 putting it all together: from net effect estimate to the certainty of net benefit.  BMJ Evidence-Based Medicine 2018;23(Supplement 1):
http://dx.doi.org/10.1136/bmjebm-2018-111024.6

Alper BSはウェブツールとしてNet Effect Calculatorを公開しています(EBSCO Health DynaMed Pus)。

Alper BS, Oettgen P, Kunnamo I, Iorio A, Ansari MT, Murad MH, Meerpohl JJ, Qaseem A, Hultcrantz M, Schünemann HJ, Guyatt G, GRADE Working Group: Defining certainty of net benefit: a GRADE concept paper. BMJ Open 2019;9:e027445. doi: 10.1136/bmjopen-2018-027445 PMID: 31167868

Elstein AS: On the origins and development of evidence-based medicine and medical decision making. Inflamm Res 2004;53 Suppl 2:S184-9. doi: 10.1007/s00011-004-0357-2 PMID: 15338074

Gail MH, Costantino JP, Bryant J, Croyle R, Freedman L, Helzlsouer K, Vogel V: Weighing the risks and benefits of tamoxifen treatment for preventing breast cancer. J Natl Cancer Inst 1999;91:1829-46. PMID: 10547390

———————————————-
Alper BSはNet Effect Calculatorを公開しています(文献欄にリンクしてあります)。これは、二値変数アウトカムの場合、Gail/NCIの方法(Gail MH 1999)に準じているようで、Net effect正味の効果の点推定値とその信頼区間が算出されます。ただし、各アウトカムに対する効果の間に相関がある場合は、適用できないことになっています。

正味の効果とは、各アウトカムの重要性を設定し、それぞれのアウトカムに対する効果の大きさを最重要アウトカムの値に調整して、複数のアウトカムに対する効果の総和を算出したものです。例えば、最重要アウトカムの重要性が1.0でリスク差が100人に-10人、重要性を0.5に設定したアウトカムのリスク差が100人に4人の場合、後者は100人に4×0.5=2人分とみなして、総和を計算します。前者が、有害事象が減少する場合で、マイナスの値、後者が有害事象が増える場合でプラスの値、とすると、この例では、正味の効果は100人で-8人となります。さらに95%信頼区間の下限値と上限値を設定しますが、この二つの値は、点推定値に対して対称になります。正味の効果推定値は正規分布に従うことを前提としており、その分布の標準偏差SDと正味の効果の推定値の95%信頼区間の値が算出されます。(なおGail/NCIの方法では正味の益が増える場合にプラスの値になるよう計算する点で相違があります。)