Comparative Effectiveness Research (CER)比較効果研究

2009年1月15日、当時のオバマ大統領が一般教書演説の中で、CER 比較効果研究の推進について述べ、11億ドルの予算がつけられ、その後の医学研究、医療に大きな影響を与えることになりました。Institute of Medicine (IOM, 現National Academy of Medicine, NAM)のCERの定義は以下の通りです。

“The generation and synthesis of evidence that compares the benefits and harms of alternative methods to prevent, diagnose, treat, and monitor a clinical condition, or to improve the delivery of care. The purpose of CER is to assist consumers, clinicians, purchasers, and policy makers to make informed decisions that will improve health care at both the individual and population levels.”

“比較効果研究CERは臨床状態の予防、診断、治療、モニターのためあるいはケアの供給を改善するための方法の選択肢の益と害を比較するエビデンスの生成と統合を行うことである。CERの目的は個人および集団の両方で、消費者、臨床家、購入者と政策決定者が、ヘルスケアを改善するであろう、情報を与えられた上での決断を支援することである。”

さらに、CERの6つの特徴として以下の項目があげられている。
1.目的は特定の臨床決断に情報をあたえること。
2.それぞれが最善の医療となる可能性のある少なくとも2つの介入の選択肢を比較すること。
3.群(population)および亜群レベルで患者アウトカムを取り扱い記述すること。
4.益だけでなく害を含む患者にとって重要なアウトカムを測定すること。
5.対象となる決断に適切な研究手法およびデータソースを用いること。
6.介入が用いられるであろうセッティングに可能な限り近いセッティングで行われる。

定義およびこれらの項目からCERに関するキーワードをあげると以下のようになるでしょう。
Effectivenessすなわち実臨床における効果、②患者中心アウトカム、③益と害の評価、④決断支援、⑤選択肢の比較、⑥すべてのステークホルダーの最大限の参加・貢献および結果の活用、⑦エビデンスの生成と統合(一次研究と二次研究であるシステマティックレビュー/メタアナリシス)

PubMed Special Queries: Directory of Topic-Specific PubMed QueriesにはComparative Effectiveness Researchの検索式が用意されており、Research Categoryとして、
 〇Randomized controlled trials,
 〇Observational Studies (cohort, administrative data, registries, and electronic health records), 
 〇Systematic Reviews, Simulations, Models、
Selected Topicsとして、
 〇Health Disparities,
 〇Costs and Cost Analysis, 
 〇Comparative Effectiveness Research as Subject
が検索語句と組み合わせてPubMed検索ができるようになっています。これらのいずれか一つあるいはすべてを選択して検索ができます。

Randomized controlled trialsではrandomized controlled trial[pt]よりもより多くの文献が引き出され、一方Cochraneのランダム化比較試験のフィルターよりも少ない文献が引き出されます。

Comparative Effectiveness Research as Subjectを組み合わせると数は少ないですが、臨床へのインパクトがありそうな論文が引き出されてきます。

たとえば、acute appendicitisで検索したところ、28件の論文が引き出されましたが、その中の2番目の論文は、Ehlers AP, Davidson GH, Deeney K, Talan DA, Flum DR, Lavallee DC: Methods for Incorporating Stakeholder Engagement into Clinical Trial Design. EGEMS (Wash DC) 2017;5:4. PMID: 29930955で、CERの考え方、Patient-centered outcomeの重視、研究デザイン策定の段階から、患者さんを含む利害関係者の参加を求めるなど、臨床研究における新しい試みが追及されていることがわかります。

PRISMA statements

PRISMA (Preferred Reporting Items for Systematic reviews and Meta-Analyses) PRISMAはシステマティックレビューとメタアナリシスにおける報告のための項目のエビデンスに基づく最小のセットで、これらの論文を執筆する際のガイダンスです。ネットワークメタアナリシス、診断精度研究のメタアナリシスなどについても発表されています。

Scopingスコーピング Tricco AC, et al: PRISMA Extension for Scoping Reviews (PRISMA-ScR): Checklist and Explanation. Ann Intern Med 2018;169:467-473. PMID: 30178033

DTA診断精度研究 McInnes MDF, et al: Preferred Reporting Items for a Systematic Review and Meta-analysis of Diagnostic Test Accuracy Studies: The PRISMA-DTA Statement. JAMA 2018;319:388-396. PMID: 29362800

Harms害の研究 Zorzela L, et al: PRISMA harms checklist: improving harms reporting in systematic reviews. BMJ 2016;352:i157. PMID: 26830668

Network meta-analysisネットワークメタアナリシス Hutton B, et al: The PRISMA extension statement for reporting of systematic reviews incorporating network meta-analyses of health care interventions: checklist and explanations. Ann Intern Med 2015;162:777-84. PMID: 26030634

Individual Participants Data Meta-analysis IPDメタアナリシス Stewart LA, et al: Preferred Reporting Items for Systematic Review and Meta-Analyses of individual participant data: the PRISMA-IPD Statement. JAMA 2015;313:1657-65. PMID: 25919529

Protocol プロトコール Shamseer L, et al: Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015: elaboration and explanation. BMJ 2015;350:g7647. PMID: 25555855

Interventions 介入研究 Moher D, et al: Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. BMJ 2009;339:b2535. PMID: 19622551

Interventions 介入研究(詳細版)Liberati A, et al: The PRISMA statement for reporting systematic reviews and meta-analyses of studies that evaluate healthcare interventions: explanation and elaboration. BMJ 2009;339:b2700. PMID: 19622552

医療経済評価 NICEの場合

イギリス国立医療技術評価機構 National Institute for Helath and Care Excellence (NICE)は診療ガイドラインを作成・発行している公的な機関です。診療ガイドライン作成の方法・手順について、Developing NICE guidelines: the manual (PMG20)を公開しています。このマニュアルの中の第7章、7 Incorporating economic evaluationが医療経済評価の方法に関する部分です。

まず、医療経済評価で何をするのかですが、”Economic evaluation compares the costs and consequences of alternative courses of action” 「(医療)経済評価は医療の選択肢の結果と費用を比較する」と書かれています。すなわち、さまざまな予防的、診断的、治療的介入の効果について費用がどれくらいかかるかを比較するということです。”一定の効果を得るのにどれだけ費用がかかるか?”、”今までの治療法と比べて、新しい治療法はより良い結果を得るのに、どれくらい余分に費用がかかるか?”というような質問に答えるものです。後者の質問に答えるのに使われるICER Incremental Cost-Effectiveness Ratio 増分費用対効果比という一つの指標があります。Quality-Adjusted Life Years (QALYs)質調整生存年1年あたりいくらの余分な費用が必要かということを表す指標です。

この第7章の中で、NICEはICERに閾値を設定したことはないと、述べています。”NICE has never identified an ICER above which interventions should not be recommended and below which they should. However, in general, interventions with an ICER of less than £20,000* per QALY gained are considered to be cost effective.” (*約300万円)

NICEのこのマニュアルの中で取り上げられている、医療経済評価の手法は以下のとおりです:

Cost-minimisation analylsis: find the least costly alternative.     効果が同じと言える選択肢で費用が選択基準になりうる場合。
Cost-effectiveness analysis: monetary units vs non-monetary units (e.g., mortality or morbidity)     生存年、死亡回避、症状の無い人年などに対する費用。アウトカムごとに分けて検討はしない。
Cost-utility analysis: monetary units vs utility (QALYs).     Cost-effectiveness analysisの中で、Utility効用値を共通のアウトカムとして用いる方法。QALYsを用いて、異なるポピュレーション異なる地域の間の比較が可能。
Cost-consequences analylsis: costs and outcomes without aggregating or weighting.     アウトカムをUtility効用値で表すことができない場合、適用を考える。異なるアウトカムを一つの値にまとめることができない場合に有用である。
Cost-benefit analylsis: costs and benefits in common monetary terms.     健康アウトカム、それ以外のアウトカムを金銭的価値に換算して費用と比較する。

*日本語では、費用最小化分析、費用対効果分析、費用対効用分析、費用対結果分析、費用対便益分析など。”対”がない場合、-や/が使われている場合もあり。NICEは費用対効用分析を重視しているようです。

Appendix HにはAppraisal checklists: economic evaluationsが含まれており、以下の通りです。既存の医療経済評価の論文を評価する際に用いるもので、まずSection 1で適用可能性を評価し、適用可能と判断されれば、Section 2で研究の限界すなわち方法論的質を評価します。

Section 1: Applicability Yes/partly/no/unlcear/NA Comments
1.1 Is the study population appropriate for the review question?
1.2 Are the interventions appropriate for the review question?
1.3 Is the system in wich the study was conducted sufficiently similar to the current UK context?
1.4 Is the perspective for costs appropriate for the review question?
1.5 Is the perspective for outcomes appropriate for the review question?
1.6 Are all future costs and outcomes discounted appropriately?
1.7 Are QALYs, derived using NICE’s preferred methods, or an appropriate social care-related equivalent used as an outcome? If not, describe rationale and outcomes used in line with analytical perspectives taken (item 1.5 above).
1.8 Overall judgement: Directly applicable/partially applicable/not applicable

Section 2: Study limitations (the level of methodological quality) Yes/partly/no/unlcear/NA Comments
2.1 Does the model structure adequately reflect the nature of the topic under evaluation?
2.2 Is the time horizon sufficiently long to reflect all important dirrerences in costs and outcomes?
2.3 Are all impportant and relevant outcomes included?
2.4 Are the estimates of baseline outcomes from the best available source?
2.5 Are the estimates of relative intervention effects from the best available source?
2.6 Are all important and relevant costs included?
2.7 Are the estimates of resource use from the best available source?
2.8 Are the unit costs of resources from the best available source?
2.9 Is an appropriate incremental analysis presented or can it be calculated from the data?
2.10 Are all important parameters whose values are uncertain subjected to appropriate sensitivity analysis?
2.11 Has no potential financial conflict of interest been declared?
2.12 Overall assessment: Minor limitations/potentially serious limitations/very serious lilmitations

その他重要と思った点をリストアップしておきます。

★クリニカルクエスチョンと関連付けてコンセプトモデルを作る。
★対象患者に対するすべての介入、医療サービスを比較する
☆質の高いエビデンスに基づくモデルの構造を用いる。
★医療経済モデルについてはガイドライン作成の初期段階から議論し同意を図る。☆資源の制限は金銭的、スタッフ、入院ベッド、装置などすべてを含む。
★診療ガイドライン作成グループでの検討に先立ち質保証のプロセスを置く:one-way, n-way, 確率的感度分析、結果が説明可能であることを確認、中間エンドポイントと最終エンドポイントの関係を確認するなど。
☆外的妥当性の解析が可能な場合は実行すべき。
☆生存年、イベント数、生存のようなエンドポイントを提示する。
☆費用の内訳を提示する。
☆全費用と増分費用と効果をすべての選択肢について提示する。
☆多くの選択肢を比較する場合は費用あるいはアウトカムで順位を付け、順番に増分効果・増分費用を比較すること。
☆間接的比較(Network meta-analsysisのような)の場合は、限界を明確にすること。
★医療経済モデルは利害関係者に開発段階から公開すること。

☆健康効果の測定・価値づけにはQALYsを用い、健康関連QOLの測定にはEQ-5Dが好ましい。

★決定木Decision tree、マルコフモデルMarkov model、Discrete event simulationなどの方法を用いる。

PrOACT-URLと診療ガイドラインにおける益と害の解析

PrOACT-URLはProblems, Objectives, Alternatives, Consequences, Trade-offs, Uncertainty, Risk tolerance, Linked decisionsの8つのステップからなる一般的な意思決定を行う方法ですが、欧州医薬品局は許認可の際の手順としてこれを適用しています。

PrOACT-URLはFovorable effects望ましい効果すなわち益とUnfavorable effects望ましくない効果すなわち害を解析することを重要な目的とする一連の手順と言えます。

Problemでは、1. 問題の性質と文脈を明らかにし、2. 問題の枠組みを決めます。
Objectiveでは、3. 達成すべき全体としての目的を示す目標を決め、4. a) 望ましい効果とb)望ましくない効果に対する評価基準(Criteria)を決めます。
Alternativesでは、5. 評価基準を用いて評価する介入の選択肢(Alternatives)を決めます。
Consequencesでは、6. 介入の選択肢がそれぞれの評価基準に対してどれくらい効果があるかを記述、すなわち、すべての効果の大きさとそれらの望ましさあるいは重大さ、およびすべての効果の頻度を明らかにします。
Trade-offでは、7. 望ましい効果と望ましくない効果のバランスを評価します。
Uncertaintyでは、8. 望ましい効果と望ましくない効果に伴う不確実性を報告し、9.望ましい効果と望ましくない効果のバランスが不確実性にどのような影響を受けるかを考えます。
Risk toleranceでは、10. 当該医薬品に対する意思決定者のリスクに対する態度(Risk attitude)の相対的重要性を判断し、11. これが9で報告されたバランスにどのように影響するかを報告します。
Linked decisionsでは、12. 過去の類似の意思決定とこの意思決定の一致について考え、この意思決定が将来の意思決定に影響しうるかを評価します。

“Effects Table”に望ましい効果と望ましくない効果が一覧できるようまとめることを推奨しています。

診療ガイドライン作成における益と害の解析の手順とほとんど同じように見えますが、異なる用語が使われているので、まずそれを見てみましょう。

Problemはクリニカクエスチョン、文脈というのは重要臨床課題あるいはAnalytic framework、あるいは診療アルゴリズムに該当するでしょう。

Objectiveは評価基準Criteriaがアウトカムoutcome measurementに相当します。益のアウトカムと害のアウトカムの両方を設定するのは同じです。目標を決めるというのはクリニカルクエスチョンの設定に近いと思います。

Alternativesはクリニカルクエスチョンで設定する介入のI/C (Interventions/Comparators)に相当します。治療選択肢に該当します。OptionsあるいはTreatment optionsではなく、Alternativesという言葉が使われています。

Consequencesは”目的に影響を与える事象eventの結末”で、リスクマネージメントの分野では、”結果”と訳されているようです。ここでは、各アウトカムあるいは各アウトカムに対する効果推定値に相当するでしょう。

Trade-offは望ましい効果と望ましくない効果のバランスということなので、診療ガイドライン作成の場合はTrade-offという言葉ではなく望ましい効果と望ましくない効果のバランスあるいは益と害のバランスという言葉が直接使われていることになります。

Uncertaintyはアウトカムごとの介入の効果の不確実性のことを言っているので、アウトカムごとのエビデンス総体の確実性と同じことになります。不確実性が望ましい効果と望ましくない効果のバランスあるいは益と害のバランスにどのように影響するかを評価することは同じように求められています。ただし、診療ガイドライン作成の場合は、確率的感度分析を行うことはあまり行われてないので、今後の課題だと思います。

Risk toleranceリスク許容度は診療ガイドラインの場合は、評価項目として明確には設定されていないと思います。Risk seek, Risk neutral, Risk avertのようなリスクに対する態度の違いが推奨にどう影響するかはフォーマルには検討されていないと思います。リスクが高くても、うまくいけば非常に大きな効果が得られるのであれば、その医療を受けようと考える人もいますし、リスクが低くないと大きな効果が得られることがあるとしてもその医療は受けたくないという人もいます。また、診療ガイドライン作成グループとしてのリスクに対する態度も推奨作成に影響します。各アウトカムの重要性を決める際にもリスク許容度が影響し、Risk avertな人は副作用などの害に対する重要性を相対的に高く設定するでしょう。

Linked decisionsは他の診療ガイドラインや過去の診療ガイドラインの推奨との整合性をチェックしたりすれば、同じようなことをしていることになりますが、スコーピングサーチである程度カバーされるかもしれません。

両者は考え方はほとんど同じだと思いますが、もともと対象と目的がかなり違うので、科学の同じ成果が少し違う形で適用されているように思えます。異なる点についてリストアップしてみました。

項目PrOACT-URL診療ガイドライン作成
解析の範囲医薬品の審査なので当該医薬品が中心対象疾患に関連するすべての診断的・治療的介入
解析の対象多くの場合、承認の可能性が高い、効果が十分大きく確実性が高い医薬品効果が小さい、不確実性が大きい介入も解析対象となる
解析データ論文化されていないデータも解析対象になる主に論文化されているデータが解析対象になる
推奨の目的当該医薬品の承認の可否決定の支援介入を実行すべきかの意思決定の支援
リスクトレランス明確に考慮され、推奨された医薬品では小さくなる可能性が高い明確に考慮されるステップはなく、大きくなる場合もありうる
発行後の調査ポストマーケットのサーベイランスも含まれる推奨順守のサーベイランスはほとんど行われないか限定的

一方、共通点は

  1. 比較する対照が(複数)ある。
  2. トレードオフを前提に益と害の両方を複数のアウトカムにわたって解析する。
  3. 患者・介護者の選好が正味の益の大きさに影響する。
  4.  不確実性に対処する必要がある。

診療ガイドラインの場合は、ランダム化比較試験がほとんど行われていない分野も多く、診断的・治療的介入の効果について不確実性が大きく、正味の益が十分であることに確信を持てない場合でも推奨を作ることが求められるという点が一番の違いかもしれません。

先に述べたように、両者がよりどころにしているのは科学の同じ成果であり、論理的で科学的であることを最大限追及することを前提にしていますが、取り入れている分野や重要視する分野が全く同じではないことがわかります。Decision science、Risk managmentなどの分野の成果がより多く取り入れられているように思えます。