診療ガイドラインの活用促進

診療ガイドラインの普及、活用促進と推奨の順守の向上は科学的エビデンスに基づく診療ガイドラインの作成と同じくらい重要な課題です。それぞれの推奨が着実に実行されることで、医療が改善し、患者アウトカムが改善することが期待されます。しかし、診療ガイドラインの普及、活用そして推奨の順守はさまざまな因子の影響を受け、それらの程度は十分とは言えないのが現状です。

診療ガイドラインの開発の問題、推奨の提示の問題、診療ガイドラインの普及の問題、推奨の医療システムへの取り込みの問題、ICT活用の問題、医療提供者のニーズに十分応えられていない問題、患者のニーズに十分応えられていない問題、最新情報が取り込まれていない問題、新しい臨床研究への発展につなげられない問題、その他さまざまな問題を指摘することができるでしょう。

これらの問題に対処すべくさまざまな試みが行われています。すべての問題を解決するにはあらゆるステークホルダーの参加が必要になるでしょう。医療提供者が中心の診療ガイドライン作成者だけでは解決できない問題もあります。

2015年に発表されたBousquet Jらの”MACVIA-ARIA Sentinel NetworK for allergic rhinitis (MASK-rhinitis): the new generation guideline implementation”「アレルギー性鼻炎のためのMACVIA-ARIAセンチネルネットワーク(MASK-鼻炎):新世代のガイドライン導入」と題する論文は、多数の著者が名を連ねており日本からもいくつかの施設が参加している、アレルギー性鼻炎に対する国際的な試みについて述べています。European Innovation Partnership on ActiveとHealthy Ageing (EIP on AHA)のB3計画の一環として行われた研究です。タイトルに「新世代のガイドライン導入」とうたわれている程、革新的な大規模な試みと考えられます。

MACVIA-LR Contre les MAladies Chroniques pour un VIeillissement Actif en Languedoc‐Roussillon  (Fighting chronic diseases for active and healthy ageing) http://macvia.cr-languedocroussillon.fr) is a reference site of the European Innovation Partnership on Active and Healthy Ageing

ARIA Allergic Rhinitis and its Impact on Asthma
CARAT Control of Allergic Rhinitis and Asthma Test
MASK MACVIA-ARIA

診療ガイドラインと臨床決断支援ツールにICTを活用した以下の3つのツールが開発され、多言語で提供されています:
1.携帯電話(スマートフォン)による毎日のVisual Analogue Scale (VAS)による疾患コントロールの評価。
2.アレルギー性鼻炎と喘息検査のコントロール(CARAT, Control of Allergic Rhinitis and Asthma Test)。
3.医療前のオンラインツールによるアレルギーと喘息の早期診断(e-Allergy screening)。

MASK-rhinitisは、アレルギー性鼻炎の 診断、層別化、マネージメントおよび治療効果の評価のための新しいツールを代表するものであると述べられています。

また、Rapid guidelines, Living systematic reviews, Living guideline recommendationsなどの試みも広がりをみせ、クラスターランダム化比較試験で診療ガイドラインの有効性を実証しようとする試みも行われてきています。いくつかの論文を文献欄にあげておきます。

文献
Bousquet J, Schunemann HJ, Fonseca J, Samolinski B, Bachert C, Canonica GW, et al: MACVIA-ARIA Sentinel NetworK for allergic rhinitis (MASK-rhinitis): the new generation guideline implementation. Allergy 2015;70:1372-92. doi: 10.1111/all.12686 PMID: 26148220

Kowalski SC, Morgan RL, Falavigna M, Florez ID, Etxeandia-Ikobaltzeta I, Wiercioch W, Zhang Y, Sakhia F, Ivanova L, Santesso N, Schünemann HJ: Development of rapid guidelines: 1. Systematic survey of current practices and methods. Health Res Policy Syst 2018;16:61. doi: 10.1186/s12961-018-0327-8 PMID: 30005712

Florez ID, Morgan RL, Falavigna M, Kowalski SC, Zhang Y, Etxeandia-Ikobaltzeta I, Santesso N, Wiercioch W, Schünemann HJ: Development of rapid guidelines: 2. A qualitative study with WHO guideline developers. Health Res Policy Syst 2018;16:62. doi: 10.1186/s12961-018-0329-6 PMID: 30005710

Morgan RL, Florez I, Falavigna M, Kowalski S, Akl EA, Thayer KA, Rooney A, Schünemann HJ: Development of rapid guidelines: 3. GIN-McMaster Guideline Development Checklist extension for rapid recommendations. Health Res Policy Syst 2018;16:63. doi: 10.1186/s12961-018-0330-0 PMID: 30005679

Akl EA, Meerpohl JJ, Elliott J, Kahale LA, Schünemann HJ, Living Systematic Review Network: Living systematic reviews: 4. Living guideline recommendations. J Clin Epidemiol 2017;91:47-53. doi: 10.1016/j.jclinepi.2017.08.009 PMID: 28911999

Pai M, Lloyd NS, Cheng J, Thabane L, Spencer FA, Cook DJ, Haynes RB, Schünemann HJ, Douketis JD: Strategies to enhance venous thromboprophylaxis in hospitalized medical patients (SENTRY): a pilot cluster randomized trial. Implement Sci 2013;8:1. doi: 10.1186/1748-5908-8-1 PMID: 23279972

Aakhus E, Granlund I, Odgaard-Jensen J, Oxman AD, Flottorp SA: A tailored intervention to implement guideline recommendations for elderly patients with depression in primary care: a pragmatic cluster randomised trial. Implement Sci 2016;11:32. doi: 10.1186/s13012-016-0397-3 PMID: 26956726

Bias adjustment thresholds

2019年にAnnals of Internal MedicineにPhillippo DMらからネットワークメタアナリシスによるエビデンスの確実性からさらに臨床決断へのバイアスの影響を評価する方法について新しい手法が報告されました(1)。GRADE (Grading of Recommendations Assessment, Development and Evaluation)のエビデンス総体の確実性の評価方法(2, 3)と比較した結果が述べられています。

Bias adjustment thresholdsを用いる方法です。GRADEアプローチではバイアスリスク、非直接性、不精確性、非一貫性、出版バイアスを評価し、複数の研究をまとめたエビデンス総体の確実性の評価を行いますが、直接、臨床決断あるいは推奨への影響を評価するわけではありません。Phillippo DMらの方法では、臨床決断を逆転させるバイアスの閾値を評価し、実際の研究の結果に対してそれ以上のバイアスの影響があるかどうかを判断して、臨床決断が逆転しうるかどうかを解析しています。実際にGRADEの方法を用いた場合と異なる結論が得られることが示されています。

Phillippo DMらの論文は、もともと2016年に発表された同じグループのCaldwell DMらの論文(4)がもとになっています。さらに、2018年にはJournal of Royal Statistical SocietyのSeries AにPhillippo DM, Dias S, Ades AEらの論文(5)として発表されています。Journal of Royal Statistical Societyには2009年にTurner RMらのバイアスの定量的モデル化の論文(6)が発表されており、当然のことながら引用されています。

ネットワークメタアナリシスだけでなく通常のペア比較のメタアナリシスについても同じ手法が適用可能です。非常に重要な論文だと思います。

文献:
(1) Phillippo DM, Dias S, Welton NJ, Caldwell DM, Taske N, Ades AE: Threshold Analysis as an Alternative to GRADE for Assessing Confidence in Guideline Recommendations Based on Network Meta-analyses. Ann Intern Med 2019;170:538-546. PMID: 30909295
(2) Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, Atkins D, Kunz R, Montori V, Jaeschke R, Rind D, Dahm P, Akl EA, Meerpohl J, Vist G, Berliner E, Norris S, Falck-Ytter Y, Schünemann HJ: GRADE guidelines: 11. Making an overall rating of confidence in effect estimates for a single outcome and for all outcomes. J Clin Epidemiol 2013;66:151-7. PMID: 22542023
(3) Balshem H, Helfand M, Schünemann HJ, Oxman AD, Kunz R, Brozek J, Vist GE, Falck-Ytter Y, Meerpohl J, Norris S, Guyatt GH: GRADE guidelines: 3. Rating the quality of evidence. J Clin Epidemiol 2011;64:401-6. PMID: 21208779
(4) Caldwell DM, Ades AE, Dias S, Watkins S, Li T, Taske N, Naidoo B, Welton NJ: A threshold analysis assessed the credibility of conclusions from network meta-analysis. J Clin Epidemiol 2016;80:68-76. PMID: 27430731
(5) Phillippo DM, Dias S, Ades AE, Didelez V, Welton NJ: Sensitivity of treatment recommendations to bias in network meta-analysis. J R Stat Soc Ser A Stat Soc 2018;181:843-867. PMID: 30449954
(6) Turner RM, Spiegelhalter DJ, Smith GC, Thompson SG: Bias modelling in evidence synthesis. J R Stat Soc Ser A Stat Soc 2009;172:21-47. PMID: 19381328

下の図を見て、バイアスの効果についてちょっと考えてみてください。

Bias effects. RR: Risk Ratio; Log (Natural logarithm) of RR normally distribute and are additive, while on ratio scale RR is multiplicative.

EBM 2019年

“Evidence-Based Medicine: How to practice and teach EBM”という本はSackett DLが第一著者の初版が1997年に出版されました。その後、2000, 2005, 2011年と改訂版が出版され、 2019年に第5版が出版されました。もうSackett先生の名前は著者に入ってませんが、Dedication: This book is dedicated to Dr. David L. Sackett.と書かれています。Sackett先生は2015年に他界されました。

Straus SE, Glaszious P, Richardson WS, Haynes RB: Evidence-Based Medicine: How to practice and teach EBM. (5th edition) 2019,  Elsevier Ltd., New York.です。

初版から22年経過し、その間には社会に、医療に、医学に大きな変化がありました。特にICT (Information and Communication Technology)の発展・普及、患者中心の医療、さまざまな疾患の病態の解明と新しい診断法・治療法の開発と実用化、介護・医療制度改革、医学研究や医療の情報量の増大、等々です。

EBMは医療者個人の医療の実践体系ととらえられ、個人でクリニカルクエスチョンに基づいて、文献検索を行い、関連のある研究論文を見つけ、批判的吟味をして、エビデンスを活用するというステップで考えられてきたと思います。しかし、医療情報が莫大になり、検索は簡単にできても、関連のある文献を選定する作業に時間がかかりすぎるようになってきました。さらに、それを読んでまとめるとなると非常に時間がかかり、ひとりでできる作業ではなくなってきています。医療でEBMを実践することが、個人ではできない時代になりつつあるのではないでしょうか?

下の図に示すP5のレベル3の診療ガイドライン、レベル4のレベル1~3をまとめたもの、などを情報源として用いれば十分やっていけるという考えもあるかもしれません。レベル4はUpToDate, DynaMed, Medscape Reference, Best Practice, Micromedexなどがリストアップされています。

”医療上の疑問が生じた際に、タイムリーに科学的に妥当な、最新の情報を、短時間で理解できる内容にまとめた形で、入手して、意思決定に適切に用いられるようにするにはどうすればいいのか?”それには、医師、看護師、薬剤師など医療提供者だけでは実現できません。医療提供者、医療利用者など当事者だけでなく、ICT技術者、ICT企業、出版社、クラウドサービス提供企業なども協働で参加しないとできないでしょう。

今後はレベル5のSystemsを追求すべきで、さらにエビデンス生成の分野も統合して、…こんな風に考えながら、このEBMの本のEBHC Pyramid 5を眺めているところです。

どんどん変わっていきますね。Take a “P5” approach to evidence-based information accessって書いてあるんですね。

P5というのが面白いでしょ。一番上の5.Systemsって最初何のことがわからなかったけど、これってGAFAが隆盛を誇っていることとも関係してるよね。そう思わない?P4 medicineというのもあるけど。 predictive, preventive, personalized, and participatoryって言うんだけれど。これは、Pyramid 5なんだ。

ハハハハ。面白い。Google, Apple, Facebook, Amazon!医療情報の検索はiPhoneからGoogleで、論文の内容はAIがまとめます、ドクター探しは、Facebookで、医療費の支払いもリブラで、お薬はAmazonで、ですか?それはどうかな?

でも彼らが本気で取り組めばできるんじゃないかな?資金も技術力もあるし、タレントを世界中から集められるし。

第4版では、Take a “6S” approach to evidence-based information accessになってますね。わかりやすくするために番号を付けると、一番上が(6) Systems: Computerized decision supportになってますよ。
次が、(5) Summaries: Evidence-based textbooks, (4) Synopses of syntheses: Evidence-based journal abstracts, (3) Syntheses: Systematic reviews, (2) Synopses of studies: Evidence-based journal abstracts, (1) Studies: Original journal articlesの順ですね。

こういうのは第1版、第2版には少なくともなかったね。

Synopsis、summary, abstract概要、抄録などを見ればいいのではないかと思えてしまうよね。他の人たちが批判的吟味を行ったその結果のまとめという意味だね。結論に至った過程を信用して。。自分の頭では考えないで。。

EBM実践のステップについても、Step 3にエビデンスの妥当性とインパクト(:効果の大きさ)の批判的吟味を行うことが述べられています。この”効果の大きさ”は意思決定には非常に重要な項目です。しかし、”患者の価値観に基づいてBenefit and harmあるいはBenefit and riskを明らかにして”というような表現はStep 4にはまだ取り上げられていません。

でもこれよくできてますね。しかも、これはずっと変わっていないですね。

わかる?Impact (size of the effect)って書いてあって、エビデンスの確実性、ここでは妥当性validity (closeness to the truth)って書いてあるんだけど、それの批判的吟味を重要と考え効果の大きさのことはあまり考えない人が多いので、ここのところはいいなって思ってるんだ。

そうですよね

個人レベルでのBenefit and harm益と害の大きさを判断するには概要や抄録の結論だけでは無理ですよ。health literacyヘルスリテラシーとnumeracyニューメラシーの理解の深さがどこまで求められるかよく考えないと。

今後は、SynopsisやSummaryが個人個人の意思決定に必要な数値データを提示する必要があるんじゃないかな?

EBMの定義については、以下の様になっています。(下の方の3つの項目は自分の解釈です。)

これは巻末の用語解説に書いてあるもので、最初のIntroductionの冒頭にも”What is evidence-based medicine?”と書いてあって、”Evidence-based medicine (EBM) requires integration of the best research evidence with our clinical expertise and our patient’s unique values and circumstances.”なんて書いてあるんですよ。これは”EBMは最善の研究エビデンスと我々の臨床的専門的技能・知識と患者さん固有の価値と状況と統合することを必要とする”ということだけを述べています。

ふーん、なるほど。最初の部分がないんですね。最初の部分も重要だと思うんですけどね。状況というのはその患者さんの置かれた状況のことらしいですね。

このあたりの記述もずっと変わっていないですね。

1998年のMulrow CEの臨床決断に関与する要素にはほぼ同じような内容が示されていました。

さて、最後にForeground questionsとBackground questionsについてわかりやすい説明があります。今回はこれで最後です。

Swing weightingを用いたMCDAの結果

アウトカムOutcome=評価項目Criteriaの重要度の設定にSwing weightingという方法を用いた、成人の急性虫垂炎の抗菌薬投与による保存的治療と外科的虫垂切除の比較の例について紹介しました。参照:Keeney and Raiffaの方法 急性虫垂炎の例 その解析結果を示します。

まず、再発が無いことを重要視する場合です。下のグラフでアウトカムの右側の数字が設定した重みの値です。重みは0~100の範囲の値で、一番重要と考えたアウトカムは100に設定されます。それ以外のアウトカムには、それに対して相対的な値を設定します。

図1.アウトカムの右側に重みの値を示します。黒が外科的虫垂切除、赤が抗菌薬投与による保存的治療。

このような重みづけの組み合わせの場合は、再発が無いことを一番重要と考えていることになりますが、MCDAの結果では、次の様に外科的虫垂切除の方が総スコアAggregate scoreが高くなりました。分布は効果推定値=パラメータの不確実性を全体として反映していますが、各パラメータの間の共分散も含めて分散に掛け算される係数の値も取り込んだ総計に基づき計算しています。

効果推定値は各群の率あるいは平均値で、それらを4つの研究からメタアナリシスの手法でまとめた統合値を用いています。図1の黒の三角が外科的虫垂切除の場合、赤の三角が抗菌薬投与による保存的治療の場合です。率については正規分布に近似することを前提に分散の逆数で重みづけしたランダム効果モデルによる統合値と標準誤差、連続変数の平均値の場合は、分散の逆数で重みづけしたランダム効果モデルによる統合値と標準偏差の値を用いました。最善値、最悪値は二つの選択肢における95%信頼限界の最大値あるいは最小値を用いてスコアリングを行っています。

もし図1で黒または赤の三角のいずれかがすべてのアウトカムで矢じりの側にあれば、それだけでどのような重みづけの場合でも、その介入の方を選択すべきだとわかります。今回の例では、アウトカム毎に相対的位置が異なっており、トレードオフのあることがわかります。

また、もしすべてのアウトカムに対して、ありうる最善の効果の介入があるとしたら、総スコアは100になりますし、すべてのアウトカムに対してありうる最悪の効果の介入があるとしたら0になります。

図2.介入群:抗菌薬投与による保存的治療と対照群:外科的虫垂切除の総スコアの確率密度分布。

さらに、二つの選択肢の総スコアの差を求めると、外科的虫垂切除を対照としているので、介入―対照の値はマイナスとなり(対照の外科的切除の総スコアの方が大きい)、外科的虫垂切除の方が望ましいという結果になります。その差がプラスになり、介入すなわち抗菌薬投与による保存的治療の総スコアが上回る確率は0.032です。

従って、このような価値観を持つ人の場合は、外科手術を希望するでしょうし、このMCDAの結果もそれを支持しています。

図3.介入―対照の総スコアの差の分布。

それぞれのアウトカムに対する重みを0から100の間で10ずつ変動させた場合にどうなるか見た、つまり感度分析の、結果が次のグラフです。一つのアウトカムの重みを変える場合、それ以外のアウトカムに対する重みは最初に設定した値のままです。それぞれのグラフで青い点線で示すところが、すべてのアウトカムの重みが最初に設定した値の場合に相当します。縦のバーは95%信頼区間を示します。

図4.感度分析:総スコアと95%信頼区間。黒が外科的虫垂切除、赤が抗菌薬投与による保存的治療。

このグラフを見ると、1ヶ月以降1年以内の再発と1か月以内の手術、および費用は重みを変動させるとそれ以外のアウトカムの重みは変えない場合、総スコアが逆転し、抗菌薬投与による保存的治療の総スコアの方がより大きくなりうることがわかります。ただし、費用の重みを50以上にすると、抗菌薬投与による保存的治療の総スコアが外科的虫垂切除の総スコアを上回りますが、1ヶ月以降1年以内の再発や1か月以内の手術といった健康関連アウトカムに対して、費用の重みを50まで増加させることは非常に考えにくいと思います。

それでは、一か月以内に手術を受けないで済むことにもう少し価値を置く場合はどうなるでしょうか。次の図のような重みの場合です。上記の場合とは1ヶ月以内の虫垂切除の重みを20から60に変えたところが違います。他のアウトカムの重みは同じです。

図5.1ヶ月以内の手術の重みを増やした場合。黒が外科的虫垂切除、赤が抗菌薬投与による保存的治療。図1と同じグラフでアウトカムの右に書かれている重みの値が異なる。
図6.2つの選択肢の総スコアはほとんど差がない。。

こうすると、2つの選択肢の総スコアはほとんど同じになります。

差でみても同様です。

図7.抗菌薬投与による保存的治療の総スコア – 外科的虫垂切除の総スコアの分布。

すなわち、1ヶ月以降1年以内の再発は嫌だから、それを一番重要なアウトカムと考えるが、手術を受けないで済めばそれに越したことはない、というような価値観の人の場合は、どちらがいいか迷うでしょう。このMCDAの結果もそれを支持しているように見えます。どちらの治療選択肢でも価値に大差はないと考えられます。あるいは、再発もなく、手術も受けないで済むという、両方の良いとこ取りはできないということでもあります。

各アウトカムに対する重みを変動させた場合のグラフは次の通りです。この場合は、1ヶ月以内の虫垂切除の重みをより大きくすれば抗菌薬投与による保存的治療の総スコアが外科的虫垂切除の総スコアを上回ります。つまり、外科手術は受けたくないという気持ちが強い場合は抗菌薬投与による保存的治療の総スコアがより大きくなるということです

図8.感度分析:各アウトカムの重みを変動させた場合。

そして、1ヶ月以内に手術を受けないで済むことに対する重みを100にして、1ヶ月以降1年以内の再発の重みを70にした場合はどうなるでしょうか。この場合は、できるだけ手術を受けないで済むことに最も大きな価値を置くが、再発はある程度許容するという価値観になると思います。

図9.1ヶ月以内に手術を受けないで済むことを最も重要視する場合。黒が外科的虫垂切除、赤が抗菌薬投与による保存的治療。図1、5と同じグラフでアウトカムの右に書かれている重みの値が異なる。

この場合は、当然と言えば当然ですが、抗菌薬投与による保存的治療の総スコアが外科的虫垂切除の総スコアを上回ります。

図10.総スコアの差でみても同様です。

図11.抗菌薬投与による保存的治療の総スコアが外科的虫垂切除の総スコアを上回る確率はほぼ1になる。

各アウトカムの重みを変動させた場合のグラフは次の通りです。この場合も、1ヶ月以内に手術を受けることの重みを変動させると、逆転が生じます。

図12.感度分析:アウトカムの重みを変動させた場合の総スコア変動。

さて、これらの解析結果を見ると、Keeny and RaiffaのSwing weightingを用いるMCDA (Multi-Criteria Decision Analysis)はアウトカムの重みづけと総スコアの関係が納得できるものであり、人が感じる価値を正確にとらえることができる方法ではないかと思えます。しかも、元の尺度が異なる値を統合して総スコア化でき、それが人の感覚とよく符合するということは、優れた決断モデルであり、優れた決断分析の手法であると考えられます。なお、ここで示した分析はRを用いて管理者が作成したスクリプトで行いました。