医療経済評価 NICEの場合

イギリス国立医療技術評価機構 National Institute for Helath and Care Excellence (NICE)は診療ガイドラインを作成・発行している公的な機関です。診療ガイドライン作成の方法・手順について、Developing NICE guidelines: the manual (PMG20)を公開しています。このマニュアルの中の第7章、7 Incorporating economic evaluationが医療経済評価の方法に関する部分です。

まず、医療経済評価で何をするのかですが、”Economic evaluation compares the costs and consequences of alternative courses of action” 「(医療)経済評価は医療の選択肢の結果と費用を比較する」と書かれています。すなわち、さまざまな予防的、診断的、治療的介入の効果について費用がどれくらいかかるかを比較するということです。”一定の効果を得るのにどれだけ費用がかかるか?”、”今までの治療法と比べて、新しい治療法はより良い結果を得るのに、どれくらい余分に費用がかかるか?”というような質問に答えるものです。後者の質問に答えるのに使われるICER Incremental Cost-Effectiveness Ratio 増分費用対効果比という一つの指標があります。Quality-Adjusted Life Years (QALYs)質調整生存年1年あたりいくらの余分な費用が必要かということを表す指標です。

この第7章の中で、NICEはICERに閾値を設定したことはないと、述べています。”NICE has never identified an ICER above which interventions should not be recommended and below which they should. However, in general, interventions with an ICER of less than £20,000* per QALY gained are considered to be cost effective.” (*約300万円)

NICEのこのマニュアルの中で取り上げられている、医療経済評価の手法は以下のとおりです:

Cost-minimisation analylsis: find the least costly alternative.     効果が同じと言える選択肢で費用が選択基準になりうる場合。
Cost-effectiveness analysis: monetary units vs non-monetary units (e.g., mortality or morbidity)     生存年、死亡回避、症状の無い人年などに対する費用。アウトカムごとに分けて検討はしない。
Cost-utility analysis: monetary units vs utility (QALYs).     Cost-effectiveness analysisの中で、Utility効用値を共通のアウトカムとして用いる方法。QALYsを用いて、異なるポピュレーション異なる地域の間の比較が可能。
Cost-consequences analylsis: costs and outcomes without aggregating or weighting.     アウトカムをUtility効用値で表すことができない場合、適用を考える。異なるアウトカムを一つの値にまとめることができない場合に有用である。
Cost-benefit analylsis: costs and benefits in common monetary terms.     健康アウトカム、それ以外のアウトカムを金銭的価値に換算して費用と比較する。

*日本語では、費用最小化分析、費用対効果分析、費用対効用分析、費用対結果分析、費用対便益分析など。”対”がない場合、-や/が使われている場合もあり。NICEは費用対効用分析を重視しているようです。

Appendix HにはAppraisal checklists: economic evaluationsが含まれており、以下の通りです。既存の医療経済評価の論文を評価する際に用いるもので、まずSection 1で適用可能性を評価し、適用可能と判断されれば、Section 2で研究の限界すなわち方法論的質を評価します。

Section 1: Applicability Yes/partly/no/unlcear/NA Comments
1.1 Is the study population appropriate for the review question?
1.2 Are the interventions appropriate for the review question?
1.3 Is the system in wich the study was conducted sufficiently similar to the current UK context?
1.4 Is the perspective for costs appropriate for the review question?
1.5 Is the perspective for outcomes appropriate for the review question?
1.6 Are all future costs and outcomes discounted appropriately?
1.7 Are QALYs, derived using NICE’s preferred methods, or an appropriate social care-related equivalent used as an outcome? If not, describe rationale and outcomes used in line with analytical perspectives taken (item 1.5 above).
1.8 Overall judgement: Directly applicable/partially applicable/not applicable

Section 2: Study limitations (the level of methodological quality) Yes/partly/no/unlcear/NA Comments
2.1 Does the model structure adequately reflect the nature of the topic under evaluation?
2.2 Is the time horizon sufficiently long to reflect all important dirrerences in costs and outcomes?
2.3 Are all impportant and relevant outcomes included?
2.4 Are the estimates of baseline outcomes from the best available source?
2.5 Are the estimates of relative intervention effects from the best available source?
2.6 Are all important and relevant costs included?
2.7 Are the estimates of resource use from the best available source?
2.8 Are the unit costs of resources from the best available source?
2.9 Is an appropriate incremental analysis presented or can it be calculated from the data?
2.10 Are all important parameters whose values are uncertain subjected to appropriate sensitivity analysis?
2.11 Has no potential financial conflict of interest been declared?
2.12 Overall assessment: Minor limitations/potentially serious limitations/very serious lilmitations

その他重要と思った点をリストアップしておきます。

★クリニカルクエスチョンと関連付けてコンセプトモデルを作る。
★対象患者に対するすべての介入、医療サービスを比較する
☆質の高いエビデンスに基づくモデルの構造を用いる。
★医療経済モデルについてはガイドライン作成の初期段階から議論し同意を図る。☆資源の制限は金銭的、スタッフ、入院ベッド、装置などすべてを含む。
★診療ガイドライン作成グループでの検討に先立ち質保証のプロセスを置く:one-way, n-way, 確率的感度分析、結果が説明可能であることを確認、中間エンドポイントと最終エンドポイントの関係を確認するなど。
☆外的妥当性の解析が可能な場合は実行すべき。
☆生存年、イベント数、生存のようなエンドポイントを提示する。
☆費用の内訳を提示する。
☆全費用と増分費用と効果をすべての選択肢について提示する。
☆多くの選択肢を比較する場合は費用あるいはアウトカムで順位を付け、順番に増分効果・増分費用を比較すること。
☆間接的比較(Network meta-analsysisのような)の場合は、限界を明確にすること。
★医療経済モデルは利害関係者に開発段階から公開すること。

☆健康効果の測定・価値づけにはQALYsを用い、健康関連QOLの測定にはEQ-5Dが好ましい。

★決定木Decision tree、マルコフモデルMarkov model、Discrete event simulationなどの方法を用いる。

PrOACT-URLと診療ガイドラインにおける益と害の解析

PrOACT-URLはProblems, Objectives, Alternatives, Consequences, Trade-offs, Uncertainty, Risk tolerance, Linked decisionsの8つのステップからなる一般的な意思決定を行う方法ですが、欧州医薬品局は許認可の際の手順としてこれを適用しています。

PrOACT-URLはFovorable effects望ましい効果すなわち益とUnfavorable effects望ましくない効果すなわち害を解析することを重要な目的とする一連の手順と言えます。

Problemでは、1. 問題の性質と文脈を明らかにし、2. 問題の枠組みを決めます。
Objectiveでは、3. 達成すべき全体としての目的を示す目標を決め、4. a) 望ましい効果とb)望ましくない効果に対する評価基準(Criteria)を決めます。
Alternativesでは、5. 評価基準を用いて評価する介入の選択肢(Alternatives)を決めます。
Consequencesでは、6. 介入の選択肢がそれぞれの評価基準に対してどれくらい効果があるかを記述、すなわち、すべての効果の大きさとそれらの望ましさあるいは重大さ、およびすべての効果の頻度を明らかにします。
Trade-offでは、7. 望ましい効果と望ましくない効果のバランスを評価します。
Uncertaintyでは、8. 望ましい効果と望ましくない効果に伴う不確実性を報告し、9.望ましい効果と望ましくない効果のバランスが不確実性にどのような影響を受けるかを考えます。
Risk toleranceでは、10. 当該医薬品に対する意思決定者のリスクに対する態度(Risk attitude)の相対的重要性を判断し、11. これが9で報告されたバランスにどのように影響するかを報告します。
Linked decisionsでは、12. 過去の類似の意思決定とこの意思決定の一致について考え、この意思決定が将来の意思決定に影響しうるかを評価します。

“Effects Table”に望ましい効果と望ましくない効果が一覧できるようまとめることを推奨しています。

診療ガイドライン作成における益と害の解析の手順とほとんど同じように見えますが、異なる用語が使われているので、まずそれを見てみましょう。

Problemはクリニカクエスチョン、文脈というのは重要臨床課題あるいはAnalytic framework、あるいは診療アルゴリズムに該当するでしょう。

Objectiveは評価基準Criteriaがアウトカムoutcome measurementに相当します。益のアウトカムと害のアウトカムの両方を設定するのは同じです。目標を決めるというのはクリニカルクエスチョンの設定に近いと思います。

Alternativesはクリニカルクエスチョンで設定する介入のI/C (Interventions/Comparators)に相当します。治療選択肢に該当します。OptionsあるいはTreatment optionsではなく、Alternativesという言葉が使われています。

Consequencesは”目的に影響を与える事象eventの結末”で、リスクマネージメントの分野では、”結果”と訳されているようです。ここでは、各アウトカムあるいは各アウトカムに対する効果推定値に相当するでしょう。

Trade-offは望ましい効果と望ましくない効果のバランスということなので、診療ガイドライン作成の場合はTrade-offという言葉ではなく望ましい効果と望ましくない効果のバランスあるいは益と害のバランスという言葉が直接使われていることになります。

Uncertaintyはアウトカムごとの介入の効果の不確実性のことを言っているので、アウトカムごとのエビデンス総体の確実性と同じことになります。不確実性が望ましい効果と望ましくない効果のバランスあるいは益と害のバランスにどのように影響するかを評価することは同じように求められています。ただし、診療ガイドライン作成の場合は、確率的感度分析を行うことはあまり行われてないので、今後の課題だと思います。

Risk toleranceリスク許容度は診療ガイドラインの場合は、評価項目として明確には設定されていないと思います。Risk seek, Risk neutral, Risk avertのようなリスクに対する態度の違いが推奨にどう影響するかはフォーマルには検討されていないと思います。リスクが高くても、うまくいけば非常に大きな効果が得られるのであれば、その医療を受けようと考える人もいますし、リスクが低くないと大きな効果が得られることがあるとしてもその医療は受けたくないという人もいます。また、診療ガイドライン作成グループとしてのリスクに対する態度も推奨作成に影響します。各アウトカムの重要性を決める際にもリスク許容度が影響し、Risk avertな人は副作用などの害に対する重要性を相対的に高く設定するでしょう。

Linked decisionsは他の診療ガイドラインや過去の診療ガイドラインの推奨との整合性をチェックしたりすれば、同じようなことをしていることになりますが、スコーピングサーチである程度カバーされるかもしれません。

両者は考え方はほとんど同じだと思いますが、もともと対象と目的がかなり違うので、科学の同じ成果が少し違う形で適用されているように思えます。異なる点についてリストアップしてみました。

項目PrOACT-URL診療ガイドライン作成
解析の範囲医薬品の審査なので当該医薬品が中心対象疾患に関連するすべての診断的・治療的介入
解析の対象多くの場合、承認の可能性が高い、効果が十分大きく確実性が高い医薬品効果が小さい、不確実性が大きい介入も解析対象となる
解析データ論文化されていないデータも解析対象になる主に論文化されているデータが解析対象になる
推奨の目的当該医薬品の承認の可否決定の支援介入を実行すべきかの意思決定の支援
リスクトレランス明確に考慮され、推奨された医薬品では小さくなる可能性が高い明確に考慮されるステップはなく、大きくなる場合もありうる
発行後の調査ポストマーケットのサーベイランスも含まれる推奨順守のサーベイランスはほとんど行われないか限定的

一方、共通点は

  1. 比較する対照が(複数)ある。
  2. トレードオフを前提に益と害の両方を複数のアウトカムにわたって解析する。
  3. 患者・介護者の選好が正味の益の大きさに影響する。
  4.  不確実性に対処する必要がある。

診療ガイドラインの場合は、ランダム化比較試験がほとんど行われていない分野も多く、診断的・治療的介入の効果について不確実性が大きく、正味の益が十分であることに確信を持てない場合でも推奨を作ることが求められるという点が一番の違いかもしれません。

先に述べたように、両者がよりどころにしているのは科学の同じ成果であり、論理的で科学的であることを最大限追及することを前提にしていますが、取り入れている分野や重要視する分野が全く同じではないことがわかります。Decision science、Risk managmentなどの分野の成果がより多く取り入れられているように思えます。

IMI PROTECTとPPI

PPIとはPatient Public Involvementのことですが、医薬品のベネフィット・リスク評価における患者・市民の参画についてEUではかなり議論が進んでいます。

Innovative Medicines Initiative (IMI) 
 Innovative Medicines Initiative (IMI)革新的医薬品イニシアティブはEUとヨーロッパ製薬企業のパートナーシップですべての人の健康と幸福のための個別化医薬の、特に医療ニーズに十分応えられていない領域での、開発とそれらへの患者さんのアクセスを促進する研究におけるオープンなコラボレーションを促進する活動をしています。

 IMI2期プログラム(2014-2020年)を通じ約4100億円(33億ユーロ)の予算が用意されました。IMIのゴール、特に第2期(IMI2, 2014-2020)は次の世代のワクチン、新しい抗生物資のような、医薬品、治療法を開発することだそうです。

Pharmacoepidemiological Research on Outcomes of Therapeutics by a European Consortium (PROTECT) 
 治療アウトカムに関する薬剤疫学的研究ヨーロッパコンソーシアムは革新的医薬品イニシアティブ(IMI)の下で作られたプロジェクトで、医薬品の副作用をさまざまなデータソースから早期に検出し評価することを促進する一連の革新的ツールと方法を開発し、ベネフィットとリスクに関するデータの統合と提示を可能にすることを目的としています。

ベネフィットとリスクとはベネフィットとハームつまり益と害と同じ意味です。診療ガイドライン作成で介入の益と害をシステマティックレビューで明らかにするのとほとんど同じ事をすることになります。

 PROTECTは34の民間および公的パートナーの間の共同作業であり、欧州医薬品局のもとで連携しています。PROTECTでは計6つのワークパッケージが成果として発表されており、それぞれ異なる領域に焦点が当てられています。

さて、
The patient and public involvement (PPI)患者・市民の参画についてはWork Package Five (WP5)で取り扱われています。IMI PROTECT Benefit-Risk Group PAATIENT AND PUBLIC INVOLVEMENT REPORT version 1.0  Recommendations for Patient and Public Involvement in the assessment of benefit and risk of medicines. (Team leader Kimberley Hockley, Imperial college London). (PDF file)

Patient Public Involvement (PPI)の定義
Patient and public: 
”患者と市民”とは、臨床試験への参加者、患者および将来患者になりうる者、障害者、両親と保護者、健康サービス・社会福祉サービスの利用者、介護者、一般市民メンバー、これらの人々の利益を代表する組織。

Involvement:
”参画”とは、患者、市民と意思決定にあたる規制当局の間の能動的なパートナーシップであり、患者と市民を意思決定の対象者として扱うことではない。患者・市民の参画とは患者・市民とともになされるあるいは患者・市民によってなされる意思決定と定義され、患者・市民へ、に関して、あるいは、のための意思決定という意味ではない。

これらの定義はイギリスのNational Health Service (NHS)国民健康サービスにおけるより多くの市民参加をサポートしている全国規模のアドバイザリーグループであるInvolveから採用したそうです。

この報告書では、PPIが重要な場面として、a) 関連するアウトカム測定の選択、採用、除外、b)アウトカム測定の順位付けと重みづけ、が挙げられています。For example, PPI may be considered important during (a) the selection, inclusion and exclusion of relevant outcome measures, or (b) the ranking and weighting of outcome measures

WHO Handbook for Guideline Development

WHOは診療ガイドライン作成の方法としてGRADEアプローチを2007年から採用しています。 WHO Handbook for Guideline Development は2nd editionが2014年に発表されています。9章のEvidence assessmentで以下の様に述べられています。”WHO uses the Grading of Recommendations Assessment, Development and Evaluation (GRADE) approach to assess the quality of a body of evidence, and to develop and report recommendations. “

Handbookの中で、引用されているMcMaster大学のGRADEのサイトです。
GRADE Online Learning Modules [website]. Ontario: McMaster University; 2014 .
J Clin Epidに発表されているGRADE working groupの論文のリストへのリンクも引用されています。
GRADE series in the Journal of Clinical Epidemiology [website]. Maryland Heights: Elsevier Inc.; 
ウェブツールGRADEpro GDTへのリンクです。
GRADEpro Guideline Development Tool [website]. Ontario: McMaster University and Evidence Prime Inc.; 2014.

2009年には WHOのGRADEprofiler helpが発表されていました。

その後、2016年に14、15、16章が追加で発表されています。
14. Strong recommendations when the evidence is low quality.
15. Using evidence from qualitative research to develop WHO guidelines.
16. Decision-making for guideline development at WHO.

WHOが作成した診療ガイドラインについてGRADEアプローチの順守状況について評価した論文があります。その概略を紹介します。

Alexander PE, Bero L, Montori VM, Brito JP, Stoltzfus R, Djulbegovic B, Neumann I, Rave S, Guyatt G: World Health Organization recommendations are often strong based on low confidence in effect estimates. J Clin Epidemiol 2014;67:629-34. PMID: 24388966
WHOのCPGの456件の推奨のうち強い推奨289件でその95件(33%)はC、22.5%はDのレベルのエビデンスに基づいていた。

Nasser SM, Cooke G, Kranzer K, Norris SL, Olliaro P, Ford N: Strength of recommendations in WHO guidelines using GRADE was associated with uptake in national policy. J Clin Epidemiol 2015;68:703-7. PMID: 25578218
WHOのCPGの推奨の各国での採用を調査。強い推奨の82%、弱い推奨の61%が各国のCPGで取り入れられていた。弱い推奨も採用されることに注意が必要。

Alexander PE, Li SA, Gionfriddo MR, Stoltzfus RJ, Neumann I, Brito JP, Djulbegovic B, Montori VM, Schunemann HJ, Guyatt GH: Senior GRADE methodologists encounter challenges as part of WHO guideline development panels: an inductive content analysis. J Clin Epidemiol 2016;70:123-8. PMID: 26385188
WHOのCPG作成に参加したGRADE上級メソドロジストに対するインタビュー調査。パネルメンバーがGRADEガイダンスに従うことに抵抗を示し緊張が生じる。さまざまなCOIが不整合推奨に影響している、パネルの副委員長としてのメソドロジストの役割の明確化とサポートが必要。

Alexander PE, Gionfriddo MR, Li SA, Bero L, Stoltzfus RJ, Neumann I, Brito JP, Djulbegovic B, Montori VM, Norris SL, Schunemann HJ, Thabane L, Guyatt GH: A number of factors explain why WHO guideline developers make strong recommendations inconsistent with GRADE guidance. J Clin Epidemiol 2016;70:111-22. PMID: 26399903
WHOの不整合推奨の作成に関わった者に対するインタービュー調査の結果。弱い推奨は無視されることを懸念したのがひとつの理由。また、GRADE理解の限界も原因の一つであり、GRADEの原則にコミットする者を選択する、よりトレーニングをする、GRADE原則に沿って作業が進むようフォーマルな方法を考えるなどの対策が必要。

Alexander PE, Brito JP, Neumann I, Gionfriddo MR, Bero L, Djulbegovic B, Stoltzfus R, Montori VM, Norris SL, Schunemann HJ, Guyatt GH: World Health Organization strong recommendations based on low-quality evidence (study quality) are frequent and often inconsistent with GRADE guidance. J Clin Epidemiol 2016;72:98-106. PMID: 25618534
WHOは2007年公衆衛生のCPGの作成にGRADEを採用。2007-2012年に発行されたCPG33件で160個の不整合推奨(CまたはDのエビデンスで強い推奨)が認められた。15.6%は妥当、21%は正しくはBまたはAが正当化されるエビデンス、18%はGood practice statementで、46%は弱い推奨が正当化されるものであった。多くがGRADE guidanceに従っておらず、作成者の更なるトレーニングが必要。