バイアスの効果とバイアス調整

バイアスの効果はリスク比あるいはオッズ比などで表すことができます。バイアスの効果を定量的に推定できるのであれば、実際に得られた効果推定値をそれで調整して真の値により近づけることができます。

バイアスのモデル化についてはTurner RM 2009らのJournal of the Royal Statistical Society Series Aに発表された論文が精細な内容で参考になります。個別研究のバイアスドメイン・項目を評価しバイス調整をしたうえで、複数の研究のメタアナリシスの統合値を得る手法です。

バイアスの効果とバイアス調整について図にしてみました。

バイアス効果とバイアス調整。観察された効果推定値は黒、真の値はグレー、バイアス効果は青で表示。リスク比で表した場合真の値にバイアスの効果が加わって観察された値は掛け算、自然対数にすると足し算で得られる。バイアスで調整する場合は割り算あるいは引き算になる。

バイアスの効果には大きさと方向(過大評価、過小評価)と不確実性の3つの要素があります。

バイアスの効果を定量的解析する場合には、例えば、リスク比あるいはオッズ比を効果指標にした場合、自然対数に変換すると、正規分布に従うとみなせ、研究で得られた効果推定値は真の値とバイアス効果の加算された値になります。バイアス調整をする場合は、推定されるバイアス効果の大きさをリスク比で表し、その自然対数を引き算することで、真の値が得られはずです。分散は両者の合計になります。多変量正規分布の原理です。

メタアナリシスで得られた統合値の95%信頼区間の上限値(あるいは下限値)がNull effectあるいは臨床的閾値を超えるほどの大きさのバイアスの効果は簡単に計算できます。一般的に行われているバイアスリスクRisk of biasの評価結果でバイアスリスクが高く、バイアスの大きさがこの値よりも大きな効果を持っていると判断できる場合は、エビデンスの確実性が低くなると考えることができます。もし、そのようなバイアス効果の大きさがあり得ないほど大きいのであれば、ある程度のバイアスリスクがあっても、エビデンスの確実性は高いと考えることができるでしょう。

文献:
Turner RM, Spiegelhalter DJ, Smith GC, Thompson SG: Bias modelling in evidence synthesis. J R Stat Soc Ser A Stat Soc 2009;172:21-47. PMID: 19381328

Turner RM, Lloyd-Jones M, Anumba DO, Smith GC, Spiegelhalter DJ, Squires H, Stevens JW, Sweeting MJ, Urbaniak SJ, Webster R, Thompson SG: Routine antenatal anti-D prophylaxis in women who are Rh(D) negative: meta-analyses adjusted for differences in study design and quality. PLoS One 2012;7:e30711. PMID: 22319580

Darvishian M, Gefenaite G, Turner RM, Pechlivanoglou P, Van der Hoek W, Van den Heuvel ER, Hak E: After adjusting for bias in meta-analysis seasonal influenza vaccine remains effective in community-dwelling elderly. J Clin Epidemiol 2014;67:734-44. PMID: 24768004

Dias S, Sutton AJ, Welton NJ, Ades AE: Evidence synthesis for decision making 3: heterogeneity–subgroups, meta-regression, bias, and bias-adjustment. Med Decis Making 2013;33:618-40. PMID: 23804507

Thompson S, Ekelund U, Jebb S, Lindroos AK, Mander A, Sharp S, Turner R, Wilks D: A proposed method of bias adjustment for meta-analyses of published observational studies. Int J Epidemiol 2011;40:765-77. PMID: 21186183

Wilks DC, Mander AP, Jebb SA, Thompson SG, Sharp SJ, Turner RM, Lindroos AK: Dietary energy density and adiposity: employing bias adjustments in a meta-analysis of prospective studies. BMC Public Health 2011;11:48. PMID: 21255448

Wilks DC, Sharp SJ, Ekelund U, Thompson SG, Mander AP, Turner RM, Jebb SA, Lindroos AK: Objectively measured physical activity and fat mass in children: a bias-adjusted meta-analysis of prospective studies. PLoS One 2011;6:e17205. PMID: 21383837

Schnell-Inderst P, Iglesias CP, Arvandi M, Ciani O, Matteucci Gothe R, Peters J, Blom AW, Taylor RS, Siebert U: A bias-adjusted evidence synthesis of RCT and observational data: the case of total hip replacement. Health Econ 2017;26 Suppl 1:46-69. PMID: 28139089

Doi SA, Barendregt JJ, Onitilo AA: Methods for the bias adjustment of meta-analyses of published observational studies. J Eval Clin Pract 2013;19:653-7. PMID: 22845171

McCarron CE, Pullenayegum EM, Thabane L, Goeree R, Tarride JE: Bayesian hierarchical models combining different study types and adjusting for covariate imbalances: a simulation study to assess model performance. PLoS One 2011;6:e25635. PMID: 22016772

McCarron CE, Pullenayegum EM, Thabane L, Goeree R, Tarride JE: The importance of adjusting for potential confounders in Bayesian hierarchical models synthesising evidence from randomised and non-randomised studies: an application comparing treatments for abdominal aortic aneurysms. BMC Med Res Methodol 2010;10:64. PMID: 20618973

Phillippo DM, Dias S, Welton NJ, Caldwell DM, Taske N, Ades AE: Threshold Analysis as an Alternative to GRADE for Assessing Confidence in Guideline Recommendations Based on Network Meta-analyses. Ann Intern Med 2019;170:538-546. PMID: 30909295

Caldwell DM, Ades AE, Dias S, Watkins S, Li T, Taske N, Naidoo B, Welton NJ: A threshold analysis assessed the credibility of conclusions from network meta-analysis. J Clin Epidemiol 2016;80:68-76. PMID: 27430731

Phillippo DM, Dias S, Ades AE, Didelez V, Welton NJ: Sensitivity of treatment recommendations to bias in network meta-analysis. J R Stat Soc Ser A Stat Soc 2018;181:843-867. PMID: 30449954

信頼できる診療ガイドライン作成とCOI

全米科学アカデミー医学研究所Institute of Medicine (IOM, 現全米医学アカデミーNational Academy of Medicine, NAM) は2011年に”Clinical Practice Guidelines We Can Trust“を発表しています。まさに「信頼できる診療ガイドライン」です。

その中で、”第4章 信頼できる診療ガイドライン作成のための現在最善の方法とスタンダードの提言:パート1 作業の開始”でConflict of Interest (COI)利益相反に関するスタンダードが述べられています。

COIの申告、開示、管理は診療ガイドライン作成の過程の透明性確保のために必須であり、その目的は信頼できる診療ガイドラインを作成することです。この第4章はCOIに限定した議論ではなく、信頼できる診療ガイドラインを作成するために必須の事項の一つとして、COIの申告、開示、管理を位置付けています。COIについてはGuidelines International Network (G-I-N)も声明を発表していますが、こちらはCOIが中心の声明で、9つの原則について述べています。日本医学会からは「日本医学会診療ガイドライン策定参加資格基準ガイダンス2017年 」が発表されておりCOIについて詳しく述べられています。

COIは経済的COIだけではなく、知的COI Intellectual COIも問題になります。American Heart Association/the American College of Cardiology (ACC/AHA)その他9つの学会から2017年に出された高血圧の診療ガイドラインに対し、アメリカ家庭医学アカデミーは、作成プロセスの問題、より低い目標血圧によるベネフィットがわずかなことから支持しないことを決定したそうです(Miyazaki K 2018)。特に知的COIの問題、すなわちSPRINT試験の代表がガイドラインパネルの議長を務めたことが問題視されています。

IOMの”第4章 信頼できる診療ガイドライン作成のための現在最善の方法とスタンダードの提言:パート1 作業の開始”のまとめの項は以下の通りです。

  1. 透明性の確保
    1.1 CPG (Clinical Practice Guideline)の作成と資金調達の過程は明確、詳細で公衆がアクセスできるようにすべきである。
  2. 利益相反(COI)の管理
    2.1 ガイドライン作成グループ(GDG, Guideline Development Group)の選任に先立ち、参加を考慮中の個人は作成グループの活動との間でCOIを生じうるすべての利益と活動を招集者に書面で申告すべきである。
    ・申告は現在の、そして計画されている、CPGの想定されるスコープに関連する商業的(そこから収入のかなりの部分を得ている業務・サービスも含む)、非商業的、知的、患者‐公衆に関する活動のすべてを反映すべきである。
    2.2 GDG内でのCOIの申告:
    ・GDGメンバーのすべてのCOIはその仕事を開始する前に報告され、これから形成されるであろう作成グループによって議論されるべきである。
    ・各パネルメンバーはそのCOIが診療ガイドライン作成プロセスあるいは個別推奨にどのように影響しうるかを説明すべきである。
    2.3 (株式などの)処分
    ・GDGメンバーは各自および家族が保有する経済的投資を自ら売却・処分すべきで、その利益が診療ガイドラインの推奨により影響を受けうる企業体のマーケティングあるいはアドバイザリーボードに参加すべきではない。
    2.4 適用除外Exclusions
    ・可能な限りGDGメンバーはCOIを有するべきではない。
    ・いくつかの状況では、メンバーは診療ガイドラインに関連のあるサービスから収入のかなりの部分を得ている関連のある臨床専門家のような、COIを有するメンバーなしで、その仕事を遂行できないかもしれない。
    ・COIを有するメンバーはGDGの少数派にとどめるべきである。
    ・ 議長あるいは副議長はCOIを有する者であってはならない。
    ・資金提供者はCPG作成で何らかの役割を持ってはならない。
  3. ガイドライン作成グループの構成
    3.1 GDGは方法論の専門家、臨床家、そして診療ガイドラインで影響を受けるであろう集団などさまざまな人々から構成され、多くの専門分野のバランスがとれた構成にすべきである。
    3.2 患者と市民の参画は現在の患者あるいは疾患経験者、患者支援者あるいは患者・医療利用者団体の代表者をGDGに含むことで(少なくともクリニカルクエスチョン作成時点と診療ガイドライン草稿のレビューの時点で)強化すべきである。
    3.3 エビデンスの批判的吟味のトレーニングを含む、患者と医療利用者の代表の効果的な参加を増やす戦略がGDGにより採用されるべきである。
  4. 診療ガイドライン-システマティックレビューの交差(Intersection)
    4.1 診療ガイドライン作成者はInstitute of Medicineの比較効果研究のシステマティックレビューのスタンダードにより設定された基準を満たすシステマティックレビューを用いるべきである。
    4.2 システマティックレビューが特定のガイドラインに情報を与えるために特異的に実施される時は、GDGとシステマティックレビューチームは両者のスコープ、アプローチ、そしてアウトプットについて協働すべきである。

COIのことだけを論じるのではなく、いかに透明性を確保し、いかに信頼できる診療ガイドラインをつくるかという観点で議論することが重要ではないかと思います。

前立腺癌のPSAによるスクリーニング

US Preventive Services Task Force (USPSTF)は55歳から69歳までの男性の前立腺癌のPSA (Prostate Specific Antigen)の定期的検査によるスクリーニングは個別に適用すべきであると、その推奨GradeはCになっています。

一方、前立腺癌の発症は数多くの遺伝子がかかわっているpolygenicな機序によることが明らかにされています(1)。Schumacher FRが筆頭著者ですが、この研究には世界中の139施設が参加しており、多数の著者による、国際規模の一大研究の論文です。

さて、2019年Callender Tらは年齢とpolygenic profileに基づき、前立腺癌のリスクを推定し、リスクの程度によってPSAによるスクリーニングの有効性を解析した論文を発表しました(2)。10年の前立腺癌の発症リスクが4%になると、上記の年齢で4年ごとのPSAスクリーニングと比べ、過剰診断が3分の1減少するが、死亡は6.3%少ないだけという結果でした。費用対効果もすぐれており、一律にPSA測定によるスクリーニングを行うより、リスクで層別化して一定の閾値以上の場合、スクリーニングを実施べきではないかという結論です。

ポピュレーション全体で解析するとベネフィットがハーム(益が害)を上回るといえない場合でも、一定以上のリスクの亜群(Subpopulation)では正味の益が得られるということは他の状況でもありえます。Precision Medicineの方向へ進むことが必要なことは明らかです。それをどのような方法で証明するのか、どのような研究手法が必要なのか、考える必要があります。Callender Tらの研究は、”Benefit-harm and cost-effectiveness modelling study”とタイトルにも書かれている通り、実際に新たなデータを収集した訳ではありませんが、意思決定に有用ではないかと思います。

文献:
(1) Schumacher FR, Al Olama AA, Berndt SI, et al: Association analyses of more than 140,000 men identify 63 new prostate cancer susceptibility loci. Nat Genet 2018;50:928-936. PMID: 29892016
(2) Callender T, Emberton M, Morris S, Eeles R, Kote-Jarai Z, Pharoah PDP, Pashayan N: Polygenic risk-tailored screening for prostate cancer: A benefit-harm and cost-effectiveness modelling study. PLoS Med 2019;16:e1002998. PMID: 31860675

Bias adjustment thresholds

2019年にAnnals of Internal MedicineにPhillippo DMらからネットワークメタアナリシスによるエビデンスの確実性からさらに臨床決断へのバイアスの影響を評価する方法について新しい手法が報告されました(1)。GRADE (Grading of Recommendations Assessment, Development and Evaluation)のエビデンス総体の確実性の評価方法(2, 3)と比較した結果が述べられています。

Bias adjustment thresholdsを用いる方法です。GRADEアプローチではバイアスリスク、非直接性、不精確性、非一貫性、出版バイアスを評価し、複数の研究をまとめたエビデンス総体の確実性の評価を行いますが、直接、臨床決断あるいは推奨への影響を評価するわけではありません。Phillippo DMらの方法では、臨床決断を逆転させるバイアスの閾値を評価し、実際の研究の結果に対してそれ以上のバイアスの影響があるかどうかを判断して、臨床決断が逆転しうるかどうかを解析しています。実際にGRADEの方法を用いた場合と異なる結論が得られることが示されています。

Phillippo DMらの論文は、もともと2016年に発表された同じグループのCaldwell DMらの論文(4)がもとになっています。さらに、2018年にはJournal of Royal Statistical SocietyのSeries AにPhillippo DM, Dias S, Ades AEらの論文(5)として発表されています。Journal of Royal Statistical Societyには2009年にTurner RMらのバイアスの定量的モデル化の論文(6)が発表されており、当然のことながら引用されています。

ネットワークメタアナリシスだけでなく通常のペア比較のメタアナリシスについても同じ手法が適用可能です。非常に重要な論文だと思います。

文献:
(1) Phillippo DM, Dias S, Welton NJ, Caldwell DM, Taske N, Ades AE: Threshold Analysis as an Alternative to GRADE for Assessing Confidence in Guideline Recommendations Based on Network Meta-analyses. Ann Intern Med 2019;170:538-546. PMID: 30909295
(2) Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, Atkins D, Kunz R, Montori V, Jaeschke R, Rind D, Dahm P, Akl EA, Meerpohl J, Vist G, Berliner E, Norris S, Falck-Ytter Y, Schünemann HJ: GRADE guidelines: 11. Making an overall rating of confidence in effect estimates for a single outcome and for all outcomes. J Clin Epidemiol 2013;66:151-7. PMID: 22542023
(3) Balshem H, Helfand M, Schünemann HJ, Oxman AD, Kunz R, Brozek J, Vist GE, Falck-Ytter Y, Meerpohl J, Norris S, Guyatt GH: GRADE guidelines: 3. Rating the quality of evidence. J Clin Epidemiol 2011;64:401-6. PMID: 21208779
(4) Caldwell DM, Ades AE, Dias S, Watkins S, Li T, Taske N, Naidoo B, Welton NJ: A threshold analysis assessed the credibility of conclusions from network meta-analysis. J Clin Epidemiol 2016;80:68-76. PMID: 27430731
(5) Phillippo DM, Dias S, Ades AE, Didelez V, Welton NJ: Sensitivity of treatment recommendations to bias in network meta-analysis. J R Stat Soc Ser A Stat Soc 2018;181:843-867. PMID: 30449954
(6) Turner RM, Spiegelhalter DJ, Smith GC, Thompson SG: Bias modelling in evidence synthesis. J R Stat Soc Ser A Stat Soc 2009;172:21-47. PMID: 19381328

下の図を見て、バイアスの効果についてちょっと考えてみてください。

Bias effects. RR: Risk Ratio; Log (Natural logarithm) of RR normally distribute and are additive, while on ratio scale RR is multiplicative.