CHEERS statement

The Consolidated Health Economic Evaluation Reporting Standards CHEERS statement CHEERS声明ー医療経済評価における報告様式のガイダンスー は2013年に International Society for Pharmacoeconomics and Outcomes (ISPOR) 国際医薬経済・アウトカム研究学会から発表された医療経済評価に関する論文の執筆ガイダンスである。Husereau D, Drummond M, Petrou S, Carswell C, Moher D, Greenberg D, Augustovski F, Briggs AH, Mauskopf J, Loder E, ISPOR Health Economic Evaluation Publication Guidelines-CHEERS Good Reporting Practices Task Force: Consolidated Health Economic Evaluation Reporting Standards (CHEERS)–explanation and elaboration: a report of the ISPOR Health Economic Evaluation Publication Guidelines Good Reporting Practices Task Force. Value Health 2013;16:231-50. PMID: 23538175白岩らの日本語訳も発表されている。

以下の項目について、望ましい執筆方法が解説されている:
タイトルと抄録:タイトル、抄録、序論:背景と目的、方法:対象集団とサブグループ状況や場所、研究の立場、比較対照、分析期間、割引率、アウトカムの選択効果の測定、選好に基づくアウトカムの測定や評価、資源消費と費用の推計、通貨・時点・換算、モデルの選択、仮定、解析方法、結果:研究で用いたパラメータ、増分費用と増分アウトカム、不確実性異質性、考察:研究結果・限界・一般化可能性・現在の知見、その他:資金源、利益相反

太字で示した項目は、医療経済的解析のデータソースとして用いられる臨床研究の臨床疫学的な視点での評価に関係する。

Cost-Effectiveness Analysis (CEA)に関する書籍

◯ Welton NJ, Sutton AJ, Cooper N, Abrams K, Ades AE: Evidence synthesis for decision making in healthcare. (Statistics in practice), 2012, Wiley.
 “This book is at heart about a fusion of ideas from medical statistics, clinical epidemiology, decision analysis, and health economics.” と書かれているくらいで、Network meta-analysisも含め、ベイズ統計学と決断分析を背景に幅広い領域について書かれている。エビデンスの統合についても十分記載されている。Chapter 7: Evidence Synthesis in a Decision Modelling Frameworkという章がある。NICEのガイダンスに沿った方法を述べ、WinBUGSについても記述している。

◯ Neumann PJ, Sanders GD, Russell LB, Siegel JE, Ganiats TG: Cost-effectiveness in health and medicine (2nd ed). 2017, Oxford University Press. 
Box 1.1にアメリカおよび国際的な医療の領域における費用対効果分析の歴史がまとめられている。2010年に”The Patient Protection and Affordable Care Act (ACA)医療保険制度改革法(通称オバマケア)がPatient-Centered Outcomes Research Institute (PICORI)患者中心のアウトカム研究所にQALYあたりの費用の閾値を用いることを禁止した、と書かれている。(Patient Protection and Affordable Care Act, 42 U.S.C. § 18001 et seq. [2010])。

◯ Edlin R, McCabe C, Hulme C, Hall P, Wright J: Cost-effectiveness modelling for health technology assessment: A practical course. 2015, Springer. 
包括的で、実用的な内容。著者はイギリス、カナダ、ニュージーランドの人たち。 相関のあるパラメータの調整についても書かれている。

◯ Baio G, Berardi A, Heath A: Bayesian cost-effectiveness analysis with the R package BCEA. 2017, Springer.
RのパッケージBCEAの作者Gianluca Baio教授(University College London)の本。

◯ Briggs A, Sculpher M, Claxton K: Decision modelling for health economic evaluation. 2006, Oxford Unversity Press. 2012, Cambridge University Press.   
前書きに、この領域の進歩が速いこと、この本に書かれている方法は、ひとつの見方に過ぎず、必ずしも正しいわけではなく、他にもよいアプローチがあるかもしれない、と書かれている。さまざまなグラフ表示が出てくる。相関のあるパラメータの調整についても書かれている。

その他:
◯ 鎌江 伊三夫編:医療技術評価ワークブック ―臨床・政策・ビジネスへの応用。2016年、じほう。
わかりやすく実例も上げながら書かれている。

医薬品医療機器レギュラトリーサイエンス財団/編 :基礎から学ぶ医療経済評価 単行本。2014年、 じほう。

城山英明 (監修), 鎌江伊三夫 (監修), 林 良造 (監修) :医療技術の経済評価と公共政策―海外の事例と日本の針路。 2013年、じほう。


USPSTFの方針とNAMの基準

全米医学アカデミーNational Academy of Medicine 、NAM(旧全米医学研究所Institute of Medicine, IOM)のCommittee on Standards for Developing Trustworthy Clinical Practice Guidelinesは2011年にClinical Practice Guidelines We Can Trustを出版していますが、この中で信頼できる診療ガイドライン作成に必要な基準を以下の8つの領域にわたって示しています。

  1. Establishing transparancy
  2. Managmement of conflict of interest (COI)
  3. Guideline development group composition
  4. Clnical practice guideline – systematic review interssection
  5. Establishing evidence foundations for and rating strength of recommendations
  6. Articulation of recommendations
  7. External review
  8. Updating

USPSTFはU.S. Preventive Services Task Force Procedure Manualにトピックの選択から推奨作成に至るまでの方法の詳細を発表していますが、さらに、USPSTFの方針がNAMの基準をすべて満たしていることをStandards for Guideline Developmentとして発表しています。

USPSTFの推奨Grade

U.S. Preventive Services Task Force (USPSTF)米国予防医療専門委員会は癌検診など予防医療の分野で臨床的予防サービスに関するエビデンスに基づく推奨を提言している全米の予防医学とEBMの専門家のボランティアの独立したパネルです。たとえば、2016年の乳癌スクリーニング大腸癌スクリーニング、2018年の前立腺癌スクリーニングに関する推奨はよく知られていると思います。

GRADEアプローチでは、推奨は強い・弱いの2段階で、する・しないの2方向ですが、その意味、特に弱い推奨の意味を考えるのに、正味の益の確実性の概念と、USPSTFの推奨グレードの分類を理解することは重要だと思います。

USPSTFの推奨グレードはA, B, C, D, Iの5分類です。推奨グレードは正味の益Net benefitの大きさとその確実性Certaintyによって決められています。

たとえば、Grade A推奨度Aは次のように定義されています:” The USPSTF recommends the service. There is high certainty that the net benefit is substantial. ” すなわち、正味の益が十分大きいことに高い確実性がある。USPSTFはその医療サービスを推奨する、と。

そして、正味の益Net benefitCertainy確実性は、” The USPSTF defines certainty as “likelihood that the USPSTF assessment of the net benefit of a preventive service is correct.” すなわち、予防医療サービスの正味の益に関するUSPSTFの評価が正しい可能性を確実性Certaintyと定義する、と。

そして、正味の益は”The net benefit is defined as benefit minus harm of the preventive service as implemented in a general, primary care population. ” すなわち、その予防医療サービスが一般のプライマリケア集団で実行されるときの益ひく害が正味の益と定義される、と。ここでは益から害を減じた(引き算した)値を正味の益Net benefitと定義しています。2016年にAnnals of Internal MedicineにDicision Modelsに関する論文を発表しています。

Owens DK, Whitlock EP, Henderson J, Pignone MP, Krist AH, Bibbins-Domingo K, Curry SJ, Davidson KW, Ebell M, Gillman MW, Grossman DC, Kemper AR, Kurth AE, Maciosek M, Siu AL, LeFevre ML, U.S. Preventive Services Task Force*: Use of Decision Models in the Development of Evidence-Based Clinical Preventive Services Recommendations: Methods of the U.S. Preventive Services Task Force. Ann Intern Med 2016;165:501-508. PMID: 27379742

そして、確実性のレベルについては、”The USPSTF assigns a certainty level based on the nature of the overall evidence available to assess the net benefit of a preventive service. ” すなわち、”予防医療サービスの正味の益を評価するために得られたエビデンス全体の性質に基づいてUSPSTFは確実性のレベルを設定する”、と。

USPSTFは、”正味の益の確実性”という考え方を、2007年から取り入れています。そして、Grade C推奨度Cの定義は2007年に一度変更し、さらに2012年に変更して以下の記述になっています。以下にGrade AからIまでの現在の定義を示します。正味の益の大きさに関する記述の部分を太字斜体、その確実性に関する記述の部分を太字に変えてあります。

Grade A: The USPSTF recommends the service. There is high certainty that the net benefit is substantial.

Grade B: The USPSTF recommends the service. There is high certainty that the net benefit is moderate or there is moderate certainty that the net benefit is moderate to substantial.

Grade C: The USPSTF recommends selectively offering or providing this service to individual patients based on professional judgment and patient preferences. There is at least moderate certainty that the net benefit is small.

Grade D: The USPSTF recommends against the service. There is moderate or high certainty that the service has no net benefit or that the harms outweigh the benefits.

Grade I : The USPSTF concludes that the current evidence is insufficient to assess the balance of benefits and harms of the service. Evidence is lacking, of poor quality, or conflicting, and the balance of benefits and harms cannot be determined.

Grade Cは、”専門家の判断と患者の好みPreferencesに基づいて、選択的に個人個人の患者に提供することを推奨する。正味の益が小さいことに少なくとも中等度の確実性がある”と定義されています。さらに、” Grade C recommendations are particularly sensitive to patient values and circumstances. Determining whether or not the service should be offered or provided to an individual patient will typically require an informed conversation between the clinician and patient. ” すなわち、Grade Cの推奨は特に患者の価値観と状況に左右される。その医療サービスを個人個人の患者に提供すべきかどうかを決めるには臨床家と患者の間で情報を与えられたうえでの話し合いが特に必要になる”と述べられています。

また、Grade Cの場合、集団のレベルで、益と害のバランスが拮抗している、そして正味の益の程度が小さいということはいままでと変わらない、とも述べています。
Despite these revisions, the essence of the C recommendation has remained consistent: at the population level, the balance of benefits and harms is very close, and the magnitude of net benefit is small.

すなわち、集団で見ると正味の益が小さい、すなわち益を得る人の割合が小さい場合でも、個人レベルで見ると益が大きい人たちがいるので、個別の判断が必要だということでしょう。今後のPrecision Meicine 精密医療の進歩によって、また推奨の分類が変わる可能性もあるかもしれません。

USPSTFはLevels of Certainty Regarding Net Benefitすなわち正味の益に関する確実性のレベルについて、以下の様にHigh, Moderate, Lowの3段階に分類しています。

High:
The available evidence usually includes consistent results from well-designed, well-conducted studies in representative primary care populations. These studies assess the effects of the preventive service on health outcomes. This conclusion is therefore unlikely to be strongly affected by the results of future studies.

Moderate:
Evidence is sufficient to determine effects on health outcomes, but the strength of the evidence is limited by the number, quality, or consistency of the individual studies, generalizability to routine practice, or indirect nature of the evidence on health outcomes. The available evidence is sufficient to determine the effects of the preventive service on health outcomes, but confidence in the estimate is constrained by such factors as:

・The number, size, or quality of individual studies.
・Inconsistency of findings across individual studies.
・Limited generalizability of findings to routine primary care practice.
・Lack of coherence in the chain of evidence.

As more information becomes available, the magnitude or direction of the observed effect could change, and this change may be large enough to alter the conclusion.

Low:
Evidence is insufficient to assess the effects on health outcomes because of limited number or power of studies, important flaws in their design or conduct, gaps in the chain of evidence, or lack of information on important health outcomes.

The available evidence is insufficient to assess effects on health outcomes. Evidence is insufficient because of:
・ The limited number or size of studies.
・ Important flaws in study design or methods.
・ Inconsistency of findings across individual studies.
・ Gaps in the chain of evidence.
・ Findings not generalizable to routine primary care practice.
・ Lack of information on important health outcomes.

More information may allow estimation of effects on health outcomes.

ここで言う確実性の分類の基準では、効果Effectあるいは効果推定値Effect estimateについて言及しているだけで、益と害については言及していません。2007年以前のエビデンスの質Quality of Evidenceの分類ではGood, Fair, Poorとなっていましたが、基本的には同じと考えられます。

Highの評価基準項目はConsistent resultsは非一貫性:複数の研究が同じ結果を出している、Well-designedは研究デザイン:ランダム化比較試験、非ランダム化比較試験、観察研究、など、Well-conductedはバイアスリスク;選択バイアス、実行バイアス、検出バイアス、症例減少バイアス、など、Representative primary care populationは非直接性、Effects on health outcomesは非直接性、The conclusion not to be strongly affected by future studiesは不精確性とそれぞれ関連した概念です。

効果推定値の確実性と正味の益の確実性は同じとは限りません。そのため、診療ガイドライン作成のためのコンピテンスとして効果推定値に対するエビデンスの評価ができるだけでは不十分といえます。

さて、推奨グレードを実際に臨床での判断にどのように用いるかについて、USPSTFはSuggestions for Practiceすなわち実際の適用に関する提言として、次のように述べています。Grade AとBは同じ文言で、Cは個別の状況に応じて選択された患者に適用するという内容になっています。Dはしないことを推奨し、Iはそれぞれの推奨のClinical considerationsをよく読むようにということです。

Grade A: Offer or provide this service.
Grade B: Offer or provide this service.
Grade C: Offer or provide this service for selected patients depending on individual circumstances.
Grade D: Discourage the use of this service.
Grade I: Read the clnical considerations section of USPSTF Recommendation Statement. If the service is offered, patients should understand the uncertainty about the balance of benefits and harms.