エビデンスがないNo evidence

「。。。にはエビデンスがない」と言ったらその後には何が続くでしょう?

おそらく、「。。。はしない方がいい」でしょう。「。。。にはエビデンスがある」だったら?

おそらく、「。。。をした方がいい」でしょう。

果たしてこれでいいのでしょうか?

診療ガイドラインで推奨を作成する場合は、「。。。にはエビデンスがないから」「。。。をしないことを推奨する」でしょうか?「。。。にはエビデンスがあるから」「。。。をすることを推奨する」でしょうか?

エビデンスとはある・なしのどちらかでしょうか?さらに、益のエビデンスと害のエビデンスと両方考える必要があります。

US Preventive Task Force (USPSTF)は、推奨をA, B, C, D, Iに分類していることについて以前の投稿の中で述べました。この中で、Grade Cは”USPSTFは、専門家の判断と患者の好みPreferencesに基づいて、選択的に個人個人の患者に提供することを推奨する。正味の益が小さいことに少なくとも中等度の確実性がある”と定義されています。患者の好みPreferencesは患者の価値観と同義と考えてください。

Grade Iは”USPSTFは、現在のエビデンスがそのサービスの益と害のバランスを評価するのに不十分であると結論付ける。エビデンスはないか、貧弱か、あるいは矛盾しており、益と害のバランスを決められない”と定義されています。

益と害のバランスthe balance of benefits and harmsは正味の益the net benefitと同じ意味です。正味の益は、”The net benefit is defined as benefit minus harm of the preventive service as implemented in a general, primary care population. ” すなわち、その予防医療サービスが一般のプライマリケア集団で実行されるときの益ひく害が正味の益と定義される、と。ここでは益から害を減じた(引き算した)値を正味の益Net benefitと定義しています。

以上を前提に、Braithwaite RSの”EBM’s six dangerous words.” (文献)の意味を考えてみましょう。

“EBM’s six dangerous words.”とは”There is no evidence to suggest…”の6つの言葉のことです。つまり、「。。。を提案(示唆)するエビデンスはない」という表現のことです。

Braithwaite RSのこの論文における主張は、この表現は4つの意味でつかわれているので、そのどれなのかをわかるように最初からそれら4つの内のどれかの表現を使いましょうということです。

1.科学的エビデンスは決定的ではなく、どれが最善か分らない。(USPSTF Grade Iでベイジアン無情報事前分布の場合)
2.科学的エビデンスは決定的ではないが私の経験あるいはその他の知識は”X”を示唆する。(USPSTF Grade Iで”X”を示唆するベイジアン有情報事前分布の場合)
3.これは益がないことが証明されている(USPSTF Grade D)
4.これはどっちつかずで、ある患者には益が害を上回り、別の患者にはそうではない(USPSTF Grade C)

1の場合、USPSTFは、”臨床的考察のセクションを読み、もし、そのサービスを提供するのであれば、患者は益と害のバランスの不確実性を理解すべきである”とSuggestions for Practiceで述べています。すべきではないと決めつけているわけではありません。

2の場合は、1の場合と同様ですが、1と比べるとそのサービスが提供される可能性が高くなるでしょう。

1,2で事前分布Priorと言っているのは、Braithwaite RSです。USPSTFの記述にはありません。彼の考えは、その時点における仮説Hypothesisがあって、それが正しい確率P(H)が、その後データDataが得られるとその正しい確率P(H|D)はデータが正しい確率P(D)とその仮説が正しい時にそのデータが得られる確率P(D|H)によって決まるというベイズの定理の、P(H)のことです。P(H|D) = P(D|H)×P(H)/P(D)の式で表されます。

つまり、エビデンスが決定的でない、不確実性が高い場合でも、その程度は異なり、”私の経験あるいはその他の知識”の正しい確率=P(H)に相当する値は様々で、1の場合は、それが0に近い、2の場合は、もう少し大きいということになります。つまり、”今までの自分の経験や間接的なデータ、研究結果から、Xが有効の可能性が少しある”という場合と、”全くわからないが、Xはまず効果がある可能性は殆どゼロ”という場合では、判断が違ってきます。

3の場合は、害が益を上回る状態になります。だから、しない方がいい。

4の場合は、患者の価値観によって、ある患者にはすることになり、別の患者にはしなことになります。

とうことから、エビデンスがないからと言って、してはいけないという決断をすると多くの場合、間違った決断になってしまうでしょう。

臨床の現場では、何もしないという選択肢も含めて、どれかに決める必要があります。その際に、エビデンスがないからしない、という考え、また、診療ガイドラインにおいて、ランダム化比較試験がない領域では、推奨を作成することはできないという考えは、偏った考えではないでしょうか。

エビデンスの確実性は、All or nothingあるいは1か0かではありません。Quantitative Benefit-Risk Assessmentを行う際には、エビデンスの確実性を表すのに、確率分布を使います。以前の投稿、益と害の定量的評価法 Quantitative benefit-harm assessmentKeeney and RaiffaのSwing weightingを用いたMCDASwing weightingを用いたMCDAの結果、などを参照してください。

文献
Braithwaite RS: A piece of my mind. EBM’s six dangerous words. JAMA 2013;310:2149-50. doi: 10.1001/jama.2013.281996 PMID: 24281458

同じ論文が2020年に再掲されています。
Braithwaite RS: EBM’s Six Dangerous Words. JAMA 2020;323:1676-1677. doi: 10.1001/jama.2020.2855 PMID: 32369132

診療ガイドラインの活用促進

診療ガイドラインの普及、活用促進と推奨の順守の向上は科学的エビデンスに基づく診療ガイドラインの作成と同じくらい重要な課題です。それぞれの推奨が着実に実行されることで、医療が改善し、患者アウトカムが改善することが期待されます。しかし、診療ガイドラインの普及、活用そして推奨の順守はさまざまな因子の影響を受け、それらの程度は十分とは言えないのが現状です。

診療ガイドラインの開発の問題、推奨の提示の問題、診療ガイドラインの普及の問題、推奨の医療システムへの取り込みの問題、ICT活用の問題、医療提供者のニーズに十分応えられていない問題、患者のニーズに十分応えられていない問題、最新情報が取り込まれていない問題、新しい臨床研究への発展につなげられない問題、その他さまざまな問題を指摘することができるでしょう。

これらの問題に対処すべくさまざまな試みが行われています。すべての問題を解決するにはあらゆるステークホルダーの参加が必要になるでしょう。医療提供者が中心の診療ガイドライン作成者だけでは解決できない問題もあります。

2015年に発表されたBousquet Jらの”MACVIA-ARIA Sentinel NetworK for allergic rhinitis (MASK-rhinitis): the new generation guideline implementation”「アレルギー性鼻炎のためのMACVIA-ARIAセンチネルネットワーク(MASK-鼻炎):新世代のガイドライン導入」と題する論文は、多数の著者が名を連ねており日本からもいくつかの施設が参加している、アレルギー性鼻炎に対する国際的な試みについて述べています。European Innovation Partnership on ActiveとHealthy Ageing (EIP on AHA)のB3計画の一環として行われた研究です。タイトルに「新世代のガイドライン導入」とうたわれている程、革新的な大規模な試みと考えられます。

MACVIA-LR Contre les MAladies Chroniques pour un VIeillissement Actif en Languedoc‐Roussillon  (Fighting chronic diseases for active and healthy ageing) http://macvia.cr-languedocroussillon.fr) is a reference site of the European Innovation Partnership on Active and Healthy Ageing

ARIA Allergic Rhinitis and its Impact on Asthma
CARAT Control of Allergic Rhinitis and Asthma Test
MASK MACVIA-ARIA

診療ガイドラインと臨床決断支援ツールにICTを活用した以下の3つのツールが開発され、多言語で提供されています:
1.携帯電話(スマートフォン)による毎日のVisual Analogue Scale (VAS)による疾患コントロールの評価。
2.アレルギー性鼻炎と喘息検査のコントロール(CARAT, Control of Allergic Rhinitis and Asthma Test)。
3.医療前のオンラインツールによるアレルギーと喘息の早期診断(e-Allergy screening)。

MASK-rhinitisは、アレルギー性鼻炎の 診断、層別化、マネージメントおよび治療効果の評価のための新しいツールを代表するものであると述べられています。

また、Rapid guidelines, Living systematic reviews, Living guideline recommendationsなどの試みも広がりをみせ、クラスターランダム化比較試験で診療ガイドラインの有効性を実証しようとする試みも行われてきています。いくつかの論文を文献欄にあげておきます。

文献
Bousquet J, Schunemann HJ, Fonseca J, Samolinski B, Bachert C, Canonica GW, et al: MACVIA-ARIA Sentinel NetworK for allergic rhinitis (MASK-rhinitis): the new generation guideline implementation. Allergy 2015;70:1372-92. doi: 10.1111/all.12686 PMID: 26148220

Kowalski SC, Morgan RL, Falavigna M, Florez ID, Etxeandia-Ikobaltzeta I, Wiercioch W, Zhang Y, Sakhia F, Ivanova L, Santesso N, Schünemann HJ: Development of rapid guidelines: 1. Systematic survey of current practices and methods. Health Res Policy Syst 2018;16:61. doi: 10.1186/s12961-018-0327-8 PMID: 30005712

Florez ID, Morgan RL, Falavigna M, Kowalski SC, Zhang Y, Etxeandia-Ikobaltzeta I, Santesso N, Wiercioch W, Schünemann HJ: Development of rapid guidelines: 2. A qualitative study with WHO guideline developers. Health Res Policy Syst 2018;16:62. doi: 10.1186/s12961-018-0329-6 PMID: 30005710

Morgan RL, Florez I, Falavigna M, Kowalski S, Akl EA, Thayer KA, Rooney A, Schünemann HJ: Development of rapid guidelines: 3. GIN-McMaster Guideline Development Checklist extension for rapid recommendations. Health Res Policy Syst 2018;16:63. doi: 10.1186/s12961-018-0330-0 PMID: 30005679

Akl EA, Meerpohl JJ, Elliott J, Kahale LA, Schünemann HJ, Living Systematic Review Network: Living systematic reviews: 4. Living guideline recommendations. J Clin Epidemiol 2017;91:47-53. doi: 10.1016/j.jclinepi.2017.08.009 PMID: 28911999

Pai M, Lloyd NS, Cheng J, Thabane L, Spencer FA, Cook DJ, Haynes RB, Schünemann HJ, Douketis JD: Strategies to enhance venous thromboprophylaxis in hospitalized medical patients (SENTRY): a pilot cluster randomized trial. Implement Sci 2013;8:1. doi: 10.1186/1748-5908-8-1 PMID: 23279972

Aakhus E, Granlund I, Odgaard-Jensen J, Oxman AD, Flottorp SA: A tailored intervention to implement guideline recommendations for elderly patients with depression in primary care: a pragmatic cluster randomised trial. Implement Sci 2016;11:32. doi: 10.1186/s13012-016-0397-3 PMID: 26956726

Bias adjustment thresholds

2019年にAnnals of Internal MedicineにPhillippo DMらからネットワークメタアナリシスによるエビデンスの確実性からさらに臨床決断へのバイアスの影響を評価する方法について新しい手法が報告されました(1)。GRADE (Grading of Recommendations Assessment, Development and Evaluation)のエビデンス総体の確実性の評価方法(2, 3)と比較した結果が述べられています。

Bias adjustment thresholdsを用いる方法です。GRADEアプローチではバイアスリスク、非直接性、不精確性、非一貫性、出版バイアスを評価し、複数の研究をまとめたエビデンス総体の確実性の評価を行いますが、直接、臨床決断あるいは推奨への影響を評価するわけではありません。Phillippo DMらの方法では、臨床決断を逆転させるバイアスの閾値を評価し、実際の研究の結果に対してそれ以上のバイアスの影響があるかどうかを判断して、臨床決断が逆転しうるかどうかを解析しています。実際にGRADEの方法を用いた場合と異なる結論が得られることが示されています。

Phillippo DMらの論文は、もともと2016年に発表された同じグループのCaldwell DMらの論文(4)がもとになっています。さらに、2018年にはJournal of Royal Statistical SocietyのSeries AにPhillippo DM, Dias S, Ades AEらの論文(5)として発表されています。Journal of Royal Statistical Societyには2009年にTurner RMらのバイアスの定量的モデル化の論文(6)が発表されており、当然のことながら引用されています。

ネットワークメタアナリシスだけでなく通常のペア比較のメタアナリシスについても同じ手法が適用可能です。非常に重要な論文だと思います。

文献:
(1) Phillippo DM, Dias S, Welton NJ, Caldwell DM, Taske N, Ades AE: Threshold Analysis as an Alternative to GRADE for Assessing Confidence in Guideline Recommendations Based on Network Meta-analyses. Ann Intern Med 2019;170:538-546. PMID: 30909295
(2) Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, Atkins D, Kunz R, Montori V, Jaeschke R, Rind D, Dahm P, Akl EA, Meerpohl J, Vist G, Berliner E, Norris S, Falck-Ytter Y, Schünemann HJ: GRADE guidelines: 11. Making an overall rating of confidence in effect estimates for a single outcome and for all outcomes. J Clin Epidemiol 2013;66:151-7. PMID: 22542023
(3) Balshem H, Helfand M, Schünemann HJ, Oxman AD, Kunz R, Brozek J, Vist GE, Falck-Ytter Y, Meerpohl J, Norris S, Guyatt GH: GRADE guidelines: 3. Rating the quality of evidence. J Clin Epidemiol 2011;64:401-6. PMID: 21208779
(4) Caldwell DM, Ades AE, Dias S, Watkins S, Li T, Taske N, Naidoo B, Welton NJ: A threshold analysis assessed the credibility of conclusions from network meta-analysis. J Clin Epidemiol 2016;80:68-76. PMID: 27430731
(5) Phillippo DM, Dias S, Ades AE, Didelez V, Welton NJ: Sensitivity of treatment recommendations to bias in network meta-analysis. J R Stat Soc Ser A Stat Soc 2018;181:843-867. PMID: 30449954
(6) Turner RM, Spiegelhalter DJ, Smith GC, Thompson SG: Bias modelling in evidence synthesis. J R Stat Soc Ser A Stat Soc 2009;172:21-47. PMID: 19381328

下の図を見て、バイアスの効果についてちょっと考えてみてください。

Bias effects. RR: Risk Ratio; Log (Natural logarithm) of RR normally distribute and are additive, while on ratio scale RR is multiplicative.

EBM 2019年

“Evidence-Based Medicine: How to practice and teach EBM”という本はSackett DLが第一著者の初版が1997年に出版されました。その後、2000, 2005, 2011年と改訂版が出版され、 2019年に第5版が出版されました。もうSackett先生の名前は著者に入ってませんが、Dedication: This book is dedicated to Dr. David L. Sackett.と書かれています。Sackett先生は2015年に他界されました。

Straus SE, Glaszious P, Richardson WS, Haynes RB: Evidence-Based Medicine: How to practice and teach EBM. (5th edition) 2019,  Elsevier Ltd., New York.です。

初版から22年経過し、その間には社会に、医療に、医学に大きな変化がありました。特にICT (Information and Communication Technology)の発展・普及、患者中心の医療、さまざまな疾患の病態の解明と新しい診断法・治療法の開発と実用化、介護・医療制度改革、医学研究や医療の情報量の増大、等々です。

EBMは医療者個人の医療の実践体系ととらえられ、個人でクリニカルクエスチョンに基づいて、文献検索を行い、関連のある研究論文を見つけ、批判的吟味をして、エビデンスを活用するというステップで考えられてきたと思います。しかし、医療情報が莫大になり、検索は簡単にできても、関連のある文献を選定する作業に時間がかかりすぎるようになってきました。さらに、それを読んでまとめるとなると非常に時間がかかり、ひとりでできる作業ではなくなってきています。医療でEBMを実践することが、個人ではできない時代になりつつあるのではないでしょうか?

下の図に示すP5のレベル3の診療ガイドライン、レベル4のレベル1~3をまとめたもの、などを情報源として用いれば十分やっていけるという考えもあるかもしれません。レベル4はUpToDate, DynaMed, Medscape Reference, Best Practice, Micromedexなどがリストアップされています。

”医療上の疑問が生じた際に、タイムリーに科学的に妥当な、最新の情報を、短時間で理解できる内容にまとめた形で、入手して、意思決定に適切に用いられるようにするにはどうすればいいのか?”それには、医師、看護師、薬剤師など医療提供者だけでは実現できません。医療提供者、医療利用者など当事者だけでなく、ICT技術者、ICT企業、出版社、クラウドサービス提供企業なども協働で参加しないとできないでしょう。

今後はレベル5のSystemsを追求すべきで、さらにエビデンス生成の分野も統合して、…こんな風に考えながら、このEBMの本のEBHC Pyramid 5を眺めているところです。

どんどん変わっていきますね。Take a “P5” approach to evidence-based information accessって書いてあるんですね。

P5というのが面白いでしょ。一番上の5.Systemsって最初何のことがわからなかったけど、これってGAFAが隆盛を誇っていることとも関係してるよね。そう思わない?P4 medicineというのもあるけど。 predictive, preventive, personalized, and participatoryって言うんだけれど。これは、Pyramid 5なんだ。

ハハハハ。面白い。Google, Apple, Facebook, Amazon!医療情報の検索はiPhoneからGoogleで、論文の内容はAIがまとめます、ドクター探しは、Facebookで、医療費の支払いもリブラで、お薬はAmazonで、ですか?それはどうかな?

でも彼らが本気で取り組めばできるんじゃないかな?資金も技術力もあるし、タレントを世界中から集められるし。

第4版では、Take a “6S” approach to evidence-based information accessになってますね。わかりやすくするために番号を付けると、一番上が(6) Systems: Computerized decision supportになってますよ。
次が、(5) Summaries: Evidence-based textbooks, (4) Synopses of syntheses: Evidence-based journal abstracts, (3) Syntheses: Systematic reviews, (2) Synopses of studies: Evidence-based journal abstracts, (1) Studies: Original journal articlesの順ですね。

こういうのは第1版、第2版には少なくともなかったね。

Synopsis、summary, abstract概要、抄録などを見ればいいのではないかと思えてしまうよね。他の人たちが批判的吟味を行ったその結果のまとめという意味だね。結論に至った過程を信用して。。自分の頭では考えないで。。

EBM実践のステップについても、Step 3にエビデンスの妥当性とインパクト(:効果の大きさ)の批判的吟味を行うことが述べられています。この”効果の大きさ”は意思決定には非常に重要な項目です。しかし、”患者の価値観に基づいてBenefit and harmあるいはBenefit and riskを明らかにして”というような表現はStep 4にはまだ取り上げられていません。

でもこれよくできてますね。しかも、これはずっと変わっていないですね。

わかる?Impact (size of the effect)って書いてあって、エビデンスの確実性、ここでは妥当性validity (closeness to the truth)って書いてあるんだけど、それの批判的吟味を重要と考え効果の大きさのことはあまり考えない人が多いので、ここのところはいいなって思ってるんだ。

そうですよね

個人レベルでのBenefit and harm益と害の大きさを判断するには概要や抄録の結論だけでは無理ですよ。health literacyヘルスリテラシーとnumeracyニューメラシーの理解の深さがどこまで求められるかよく考えないと。

今後は、SynopsisやSummaryが個人個人の意思決定に必要な数値データを提示する必要があるんじゃないかな?

EBMの定義については、以下の様になっています。(下の方の3つの項目は自分の解釈です。)

これは巻末の用語解説に書いてあるもので、最初のIntroductionの冒頭にも”What is evidence-based medicine?”と書いてあって、”Evidence-based medicine (EBM) requires integration of the best research evidence with our clinical expertise and our patient’s unique values and circumstances.”なんて書いてあるんですよ。これは”EBMは最善の研究エビデンスと我々の臨床的専門的技能・知識と患者さん固有の価値と状況と統合することを必要とする”ということだけを述べています。

ふーん、なるほど。最初の部分がないんですね。最初の部分も重要だと思うんですけどね。状況というのはその患者さんの置かれた状況のことらしいですね。

このあたりの記述もずっと変わっていないですね。

1998年のMulrow CEの臨床決断に関与する要素にはほぼ同じような内容が示されていました。

さて、最後にForeground questionsとBackground questionsについてわかりやすい説明があります。今回はこれで最後です。