絶対リスク・絶対効果・正味の益

介入の益と害を定量的に評価するためには、絶対効果を知る必要があります。比較する2群の絶対リスクの差が絶対効果です。米AHRQ Agency for Healthcare Research and Quality医療研究・品質調査機構 のShared Decision Making (SMD)共有意思決定に関する、 SHAREアプローチのツール5:数量リテラシーでは次のような表現が使われています。「絶対リスクはひとつのグループでの健康イベントの起きる数の推定値で、より強く個人のリスクを感じさせることができる。たとえば、”喫煙者は一生の間に2倍脳卒中を起こします”というよりも、”1000人のたばこを吸わない人では3人が一生の間に脳卒中を起こし、1000人のたばこを吸う人は6人が一生の間に脳卒中を起こします”と説明すべき。」

これを読むだけで絶対リスクが何かは分かります。つまり、ひとつの群におけるアウトカムの起きた人数の割合で、単位人数当たりの頻度人数でも表すこともできます。”ひとつのグループでの健康イベントの推定値”という表現は非常に適確だと思います。後半部分で述べられている1000分6と1000分の3の差がリスク差です。つまり、暴露群の絶対リスク - 対照群の絶対リスク = リスク差です。ランダム化比較試験で介入の効果を見る場合は、介入群の絶対リスク - 対照群の絶対リスク=リスク差です。1000人あたりの頻度人数として表したいのであれば、リスク差に1000を掛け算します。

以上は、アウトカムが二値変数 binary or dichotomous variableの場合ですが、連続変数の場合は、ひとつのグループでの平均値です。ニ値変数は治癒、非治癒のような排他的な二つの事象のどちらか片方が対象者に起きます。片方が起きる割合を1から引き算するともう片方の起きる割合になります。

さて、ピクトグラムでは絶対リスクやリスク差がどのように表現されるか見てみましょう。

図1.ピクトグラム。2つのアウトカムが測定されたランダム化比較試験の結果。

架空の臨床試験ですが、ランダム化比較試験で2つのアウトカムが測定されたとします。アウトカム1は有害事象が測定されましたが、介入によるその減少が推定されており、益のアウトカムとして設定されました。アウトカム2は有害事象が測定され、介入によりその増加が推定されており、害のアウトカムとして設定されました。

試験の結果を1000人単位のピクトグラムで表すとこのスライドのようになります。 ピクトグラムでは対照群と介入群のそれぞれのアウトカムに対する絶対リスクを表すことができます。このピクトグラムは1行25人で、40行、計1000人単位で一つの群を表しています。

左の2列が対照群、右の2列が介入群で、それぞれ左側は益を得られた人数(Benetif Outcomes)を青、右側は害が起きた人数(Harm Outcomes)を赤で表しています。それぞれ塗りつぶされているアイコンの数が1000人あたりの、対応する人数を表しています。

アウトカム1の場合は、益のアウトカムとして、有害事象が測定されているので、その事象が起きなかった人数を表しています。測定された有害事象であるアウトカム1が起きた人数は対照群で500人、介入群で100人で、有害事象が減少しましたが、それぞれ1000から引き算した人数をプロットしてあります。アウトカム2の場合は、有害事象が測定されているので、そのままその事象が起きた人数を表しています。

もし、2つのアウトカムの重要度が同じであれば、対照群でBenefit Outcomesの人数から、Harm Outcomesの人数を引き算すると対照群の正味の益Dcが1000人あたりの人数として得られます。この例では、Dc=500-50 = 450となります。介入群では、同様に正味の益Di = 900-100 = 800となります。介入群の正味の益から対照群の正味の益を引き算すると、この介入によって得られる正味の益になります。すなわち、800 – 450 =350が、アウトカムの重要度を同じとみなした場合の、1000人あたりでの正味の益を表します。しかし、2つのアウトカムの重要度が同じという場合は稀でしょう。

アウトカム1の重要度を100とし、アウトカム2の重要度を20とした場合は、対照群の重要度で調整された差aDc=500 – 50×20/100 = 490、介入群の重要度で調整された差aDi=900-100×20/100 = 880となり、介入により得られる正味の益は880-490 =390となります。すなわちアウトカム1の価値に合わせた場合、1000人あたり390人がそれだけの価値のアウトカムが起きることを示します。ピクトグラムではHarm Outcomesのシェードをつけたアイコンが重要度で重みづけした頻度人数を表しています。Benefit Outcomesはアウトカム1に対応しており、測定されたアウトカム1が起きなかった、1000人あたりの人数を表しており、重要度は100にしたので、全数がシェードがついたアイコンになります。

アウトカム2はアウトカム1の5分の1の重要度なので、アウトカム1のスケールに合わせた場合、50人分を10人分、100人分を20人分とみなすことになります。これら重要度で調整された人数が赤のシェードを付けたアイコンの数になります。

リスク差から計算しても同じ結果が得られます。リスク差を計算する時は、介入群の絶対リスク-対照群の絶対リスクとして計算します。リスク差を計算すると、益のアウトカムであるアウトカム1に対して、測定された有害事象のアウトカムでは、絶対リスク 0.1-0.5 = -0.4ですが、有害事象なのでプラスマイナスを逆にし、RD1 = 0.4となります。RDはRisk Differenceです。害のアウトカムであるアウトカム2に対しては、RD2 = 0.1-0.05 = 0.05となります。アウトカムの重要度で調節しないと、正味の益=0.4-0.05=0.35となりますが、アウトカムの重要度で調整すると、正味の益=1×0.4-0.2×0.05=0.39となります。これらを1000人あたりに換算すると、390人となります。

おなじランダム化比較試験の結果をリスク差をプロットした横棒グラフにしてみます。

図2.横棒グラフによるリスク差の表示。

絶対効果 = 介入群の絶対リスク - 対照群の絶対リスク、すなわちリスク差 で計算し、介入群が優位のアウトカムは右向きの横棒、対照群が優位のアウトカムは左向きの横棒で表すと、この図のようになります。

有益事象がアウトカムとして測定された場合は、介入群が優位の場合、絶対効果はプラスの値になるので、そのまま右向きの横棒として描画します。有害事象がアウトカムとして測定された場合は、介入群が優位の場合、絶対効果はマイナスの値になるので、正負を逆にして右向きの横棒として描画します。X軸の値は0.4、1000人あたりの頻度人数400です。

有害事象がアウトカムとして測定された場合は、対照群が優位の場合、絶対効果はプラスの値になるので、左向きの横棒として描画し、左側がプラスのスケールにします。X軸の値は0.05、1000人あたりの頻度人数50です。

下段のグラフの例は、益のアウトカムの重要度を100、それに対して相対的に、害のアウトカムの重要度を20とした場合の、棒グラフです。イベント数=頻度人数を益のアウトカムの価値に合わせた人数にするため、X軸の値は、それぞれ0.4と0.01、1000人あたりの頻度人数400と10です。

いずれのグラフを見ても、介入によりアウトカム1に相当する益を受けられる人が、390人増えることが分かります。

また、このようなグラフを作成したり、グラフを解釈するには、アウトカムが有害事象なのか有益事象なのか、リスク差がいずれの群を基準にして計算し、値がプラスなのかマイナスなのかに注意が必要です。

今回取り上げた例は、益のアウトカムが1つ、害のアウトカムが1つのシンプルな例ですが、アウトカムの数がもっと多い場合、そして、アウトカムによって、優位となる介入が異なる場合は、複雑な判断が求められ、直感では処理しきれなくなるかもしれません。その時は、Multi-Criteria Decision Analysis (MCDA)のようなQuantitative Benefit-Risk AnalysisあるいはQuantitative Benefit-Harm Analysisが有用と考えられています。

アウトカムの重要度 importance of outcome は意思決定者がそのアウトカムに置く価値の大きさです。Priorities and preferences, Values and preferences, Values, Patient preferencesなどとも呼ばれています。臨床試験の際にこれらの情報を記録することも検討されています。

Valuesですから、個人個人の価値観により異なるのが普通です。その測定法として、Simple direct weighting, Swing weighting, Analytic hierarchy process, Discrete-choice experimentsなど様々な方法(Ho M 2016)が報告されています。

文献(一部のみ):
Tervonen T, Veldwijk J, Payne K, Ng X, Levitan B, Lackey LG, Marsh K, Thokala P, Pignatti F, Donnelly A, Ho M: Quantitative Benefit-Risk Assessment in Medical Product Decision Making: A Good Practices Report of an ISPOR Task Force. Value Health 2023;26:449-460. doi: 10.1016/j.jval.2022.12.006 PMID: 37005055

Brett Hauber A, Fairchild AO, Reed Johnson F: Quantifying benefit-risk preferences for medical interventions: an overview of a growing empirical literature. Appl Health Econ Health Policy 2013;11:319-29. doi: 10.1007/s40258-013-0028-y PMID: 23637054

Ho M, Saha A, McCleary KK, Levitan B, Christopher S, Zandlo K, Braithwaite RS, Hauber AB, Medical Device Innovation Consortium’s Patient Centered Benefit-Risk Steering Committee: A Framework for Incorporating Patient Preferences Regarding Benefits and Risks into Regulatory Assessment of Medical Technologies. Value Health 2016;19:746-750. doi: 10.1016/j.jval.2016.02.019 PMID: 27712701

Janssens R, Barbier L, Muller M, Cleemput I, Stoeckert I, Whichello C, Levitan B, Hammad TA, Girvalaki C, Ventura JJ, Bywall KS, Pinto CA, Schoefs E, Katz EG, Kihlbom U, Huys I: How can patient preferences be used and communicated in the regulatory evaluation of medicinal products? Findings and recommendations from IMI PREFER and call to action. Front Pharmacol 2023;14:1192770. doi: 10.3389/fphar.2019.01009 PMID: 37663265

Pragmatic Clinical Trialプラグマティック臨床試験

プラグマティック臨床試験はさまざまに定義されており、統一された定義はありませんが、例えば、CaliffとSugarmanは、「介入の益、負担、害のバランスについて意思決定者に情報を与えることを主な目的としてデザインされた研究」と定義しています.比較効果研究に包含されるような定義です.

特に重要と思われる特徴は「現実的な状況下での効果を証明する」ことが考えられます.言い換えると実用性が高い臨床試験とも言えます(図1).

図1. Pragmatic Clinical Trials プラグマティック臨床試験。今後ICTを利用して、多面的/全人的で連続的な個人のビッグデータを収集して即時解析が行われるようになる可能性があり、プラグマティック臨床試験が一般化する可能性が考えられます。

また、Pragmatic-explanatory continuum indicator summary (PRECIS)と呼ばれる、臨床試験を評価するツールが作成されています(図2).

図2. プラグマスコープの一つであるPragmatic-explanatory continuum indicator summary (PRECIS)。10個のクライテリアから臨床試験の実用性を評価します。

実用性という観点から、対象者の適格基準、介入の柔軟性、介入サービス提供者の専門性、対照サービスの提供者の専門性、対照介入の柔軟性、アウトカム、参加者のコンプライアンス、サービス提供者のアドヒアランス、アウトカムの一次分析、フォローアップの 厳密さ、これらの 10項目の基準に対して0から5点配点して、評価する ツールです.レーダーチャートの 外側のほう に位置するのは 実用性の高い いわゆる プラグマティック臨床試験 に相当します.中央部分に 小さく 描かれているのは 実用性の低い臨床試験で、いわゆる厳密なランダム化比較試験、説明的臨床試験がここに位置付けられる可能性が高いでしょう.

例えば、参加者の適格基準で、コンプライアンスが低いと思われる人は除外する、アウトカムのリスクが低いと思われる人は除外する、参加者が狭い範囲から募集されている、これらは効果の証明には有利に働きますけれども、実用性は低くなります. つまり 実世界で様々な対象者に使用された場合、予想される効果が得られない可能性が高くなります.

ランダム化比較試験は多くの場合、治療の効果を証明しやすいように設計されています.言い換えると治療効果を証明するのに最適になるようにさまざまな条件が設定されています.そのため、示された効果の大きさが一般的な状況でそのまま再現されるとは限りません.そのような臨床試験はExplanatory trials説明的臨床試験あるいは、効果を証明しやすいよう最適化されているという意味で最適条件試験などとも呼ばれています(図3)。

文献:
Califf RM, Sugarman J: Exploring the ethical and regulatory issues in pragmatic clinical trials. Clin Trials 2015;12:436-41. doi: 10.1177/1740774515598334 PMID: 26374676

Ford I, Norrie J: Pragmatic Trials. N Engl J Med 2016;375:454-63. doi: 10.1056/NEJMra1510059 PMID: 27518663

医薬品評価委員会 Pragmatic Trialsのススメ – 日本製薬工業協会. Link

Thorpe KE, et al: CMAJ 2009;180:E47-57. doi: 10.1503/cmaj.090523 PMID: 19372436

Tosh G, et al: Pragmatic vs explanatory trials: the pragmascope tool to help measure differences in protocols of mental health randomized controlled trials. Dialogues Clin Neurosci 2011;13:209-15. doi: 10.31887/DCNS.2011.13.2/gtosh PMID: 21842618

Pictogram1000ff 正味の益とピクトグラム作成

益のアウトカムと害のアウトカムを最大10個まで設定可能で、絶対リスク=単一群のイベント数を1000人あたりの人数で設定し、アウトカムの重要性を0~100で設定して、対照群と介入群の正味の益の差を計算するとともに、ピクトグラムとイベント数の差およびアウトカムの重要性で重みづけしたイベント数の差をグラフ表示するウェブツールを作成しました。ベーラインリスクとRR, OR, HR, RDの値から介入群のイベント数を計算することもできます→https://sr.xrea.jp/tool/picto/pictogram1000ff.htm

COVID-19のステロイド全身投与に関するWHOの推奨のデータを用いた例がこちらです→https://sr.xrea.jp/tool/picto/covid-19-systemic-steroid-who.htm

アウトカムの重要性の値は個人で異なるので、いろいろ値を変更して正味の益がどう変わるか試すことができます。

Pictogram効果の大きさ・益‐害の大きさを図示する

治療の効果の大きさを直感的に理解してもらうには、数字より図で示した方がいいか?おそらく個人によって、数値の方が分かりやすい人と、グラフの方が分かりやすい人がいるでしょう。

2群を比較するランダム化比較試験あるいはそれらのメタアナリシスの結果からアウトカム毎に対照群の絶対リスク(イベント率;連続変数の場合は平均値)、介入群の絶対リスク、リスク差(連続変数の場合は平均値差)=絶対効果を提示された場合、どちらの治療を受けるのが最善かを決めてもらうために、どのような結果の提示方法がいいのか?

GRADEアプローチのSummary-of-Findings (SoF)tableにはこれらのデータと研究数、対象者数、リスク比、オッズ比、ハザード比などの相対効果指標とエビデンスの確実性が表形式でまとめられています。ひとつのアウトカムについて、これらのデータが提示されています。たとえば、COVID-19に関する推奨を集積しているサイトCOVID19 Recommendations (https://covid19.recmap.org/)のWHOのステロイド全身投与に関する推奨のページを見ると、Interactive Summary of Findingsの項に9つのアウトカムに対する効果がまとめられており、例えば、28日までのMortalityは1000人中160人の死亡が126人に減り、34人(48~16人)少なくなる、リスク比0.79 (0.7-0.9)、エビデンスの確実性はModerateと記されています。

高血糖は1000人中46人増加、高ナトリウム血症は同じく26人増加。その他のアウトカムについてもデータが提示されています。これら複数のアウトカムに対する効果を益も害も含めてまとめて、正味の益がどれくらいなのかを評価することはなかなか難しい作業です。

特に益と害の大きさは、アウトカムの重要性=患者の価値観によって変わってくるうえ、主観的なものなので同一人物でも別の機会に同じ評価をするかどうかわかりません。そもそもアウトカムの重要性を数値として表すことができても、本当にその個人の価値観を正確にとらえられたかもわかりません。つまり、アウトカムの重要性にさまざまな値を設定して、どちらの治療が正味の益が大きいかをいろいろ試したうえで、決めることが必要になるでしょう。Shared Decision Makingを如何に科学的に行うかという観点からも考える必要があります。

図1. 成人の急性虫垂炎の抗菌薬投与による保存的治療と外科的虫垂切除の比較。4つのアウトカムを設定。

複数のアウトカムに対する介入の効果をイベント数からPictogramで示し、各アウトカムの重要性で重みづけした場合のイベント数の総和、正味の益Net benefitを計算するウェブページを作ってみました。同時に、アウトカム毎のアウトカムの重要性で未調整の場合と調整済みのイベント数を棒グラフで示すようにしました。図1に一つの例を示します。(現在の所、二値変数アウトカムだけが対象で、益のアウトカム4つ、害のアウトカム4つまで取り扱えます)。→Link

アウトカムの重要性は最も重要なアウトカムの場合100とし、それに対して相対的な重要性を数値で設定します。したがって、調整済みのイベント数は、最も重要なアウトカムに換算した人数になります。例えば、重要性を50と設定したアウトカムが2人で起きていた場合、重要なアウトカムであれば1人で起きたのと同じとみなすことになります。最も重要なアウトカムを1.0、中等度に重要なアウトカムに0.5、重要でないアウトカムに0という値を設定することもできます。もし、このような値を設定するとGail/NCIの方法で提案されている重みづけと同じになります。

また、アウトカムが重複して起きることに対しての調整はしていません。一人に2つのアウトカムが生起しても2人にそれぞれのアウトカムが生起した場合と同じ扱いになります。なお、それが、2つの介入の比較で問題になるケースを想定することはなかなか困難だと思います。

重要なアウトカムは一つ目に設定すようにしてありますが、それ以外のアウトカムを最重要として、そこに100を設定しても問題ありません。設定されているOutcome Valueの値から最大値を見つけ出すようにプログラムしてありますので、どのアウトカムが最大値でも、それを基準に計算を行います。なお、入力後、値を保持したHTMLファイルとしてダウンロード、保存できますが、JavaScriptのプログラムであり、ローカルのファイルを開いて作業する際はインターネット接続の環境でないと動きません。

図1の急性虫垂炎の例はこちらのLinkです。やはり、図示するだけで、理解しやすくなるというわけではないです。確かなことは、複数のアウトカムに対する介入の効果をまとめて、全体として十分な益(望ましい効果)が得られるかを知るには、計算しないとわからないということでしょう。Outcome Valueの値をいろいろ変えて結果がどうなるか試してみて下さい。

詳しい解説はまた別の機会に。明日から、新しい年、2023年が始まります。I wish you a happy new year.

文献:
•McNutt, Robert Alan. Your Health, Your Decisions: How to Work with Your Doctor to Become a Knowledge-Powered Patient. 2016, The University of North Carolina Press. →Amazon
•Gail MH, Costantino JP, Bryant J, Croyle R, Freedman L, Helzlsouer K, Vogel V: Weighing the risks and benefits of tamoxifen treatment for preventing breast cancer. J Natl Cancer Inst 1999;91:1829-46. PMID: 10547390
•Marsh K, Goetghebeur M, Thokala P: Multi-criteria decision analysis to support healthcare decisions. Springer, 2017. →Amazon