EBM crisis?

MGICappのウェブサイトPublicationsのタブを開くと、Vandvik Pの2016年のGuidelines International Network (G-I-N)における”The Evidence Ecosystem”と題する発表のビデオがあり、その2分6秒(2:06)で取り上げられている論文が、2014年のGreenhalgh TらのBMJに発表された論文です。タイトルは”Evidence based medicine: a movement in crisis?”です。7年前の論文ですが、「Evidence based medicineは多くの利点があったが、いくつかの意図されなかった負の結果があった」ことが述べられています。

Crisisとして挙げられているのは、次のようなことです:
・エビデンスに基づいた「品質マーク」が既得権益者に悪用されている。
・エビデンスの量、特に臨床ガイドラインの量が多すぎて参照しきれなくなっている。
・統計的に有意な利益は、臨床現場ではわずかmarginalなものかもしれない。
・融通の利かないルールやテクノロジーを駆使したプロンプトは、患者中心ではなくマネージメント主導のケアを生み出す可能性がある。
・エビデンスに基づくガイドラインは、複雑な多臓器疾患にはうまく対応できないことが多い。

次に、☆Real evidence based medicine(真のEBM)は次のようなものであると述べています:
・患者の倫理的なケアを最優先事項とする。
・臨床家と患者が理解できるフォーマットで個別化したエビデンスを求める。
・機械的な規則に従うことではなく専門家の決断により特徴づけられる。
・意味のある対話を通して患者と決断を共有する。
・臨床家-患者の強い関係とケアの人間的側面の上に構築する。
・エビデンスに基づく公衆衛生にはコミュニティーレベルでこれらの原則を適用する。

そして、☆真のEBMを提供するためのアクションとしては以下のものが挙げられています:
・患者はより良いエビデンス、より良い提示、よりよい説明、そしてより個別化した方法で適用されることを要求すべきである。
・臨床研修は文献検索と批判的吟味を超えた、専門家としての判断と協働意思決定Shared Decision Makingへ進むべきである。
・エビデンスサマリー、診療ガイドライン、意思決定支援ツールの作成者は利用者、目的、制約を明確にすべきである。
・出版者は研究が方法論的水準だけでなく利用しやすさusabilityの水準を満たすことを要求すべきである。
・政策決定者は既得権益者によるエビデンスの手段としての生成と利用に抵抗すべきである。
・独立した資金提供者が質の高い臨床的および公衆衛生のエビデンスの創生、統合、配布を形成することがますます必要である。
・研究計画はより広範で、より学際的で、疾患経験、エビデンスの解釈に関する心理学、臨床家と患者の交渉とエビデンスの共有、過剰診断による害の予防法を取り込むべきである。

そして、”真のEBMは個々の患者のケアを最優先事項とし、これらの状況下で、その疾患あるいは病態のこの時点で、何がこの患者のための最善の一連のアクションか、を問うものである”。”そのためには、エビデンスはその患者のために個別化されなければならない。適切なケアの決断は最善の(平均としての)エビデンスとは異なるかもしれない”と述べています。

この点ではDecision science, Multi-criteria decision analysis (MCDA)、Shared Decision Makingの理解と実践スキルが求められていると思います。

Comparative Effectiveness Research比較効果研究の必要性も関連してきます。

臨床研修はルールに従うことから、方向を変える必要があることも主張されています。”基礎的な数量リテラシーnumeracy、データベース検索、研究に対してシステマティックに質問できる能力を含む批判的吟味のスキルはEBMのコンピテンスの前提であり、臨床家はこれらを実際の患者に適用する必要がある”ということも述べられています。

最後に、☆真のEBMのためのキャンペーンとして、過剰医療への対策、すべての臨床研究の登録、医学研究おける無駄の低減、出版の水準の改善、統合化された医学教育が挙げられています。

2014年の論文なので、この論文で指摘された問題や課題は、今2021年の時点では、その後、解決されたり、解決に向かって進みつつあるものもあるでしょうし、2014年の時点ではまだわからずその後新たに出てきた問題や課題もあるでしょう。

MAGICappは、いまだ解決されていない課題に応えようとする活動のひとつのようですが、解決法はひとつではないでしょう。

エビデンスがないNo evidence

「。。。にはエビデンスがない」と言ったらその後には何が続くでしょう?

おそらく、「。。。はしない方がいい」でしょう。「。。。にはエビデンスがある」だったら?

おそらく、「。。。をした方がいい」でしょう。

果たしてこれでいいのでしょうか?

診療ガイドラインで推奨を作成する場合は、「。。。にはエビデンスがないから」「。。。をしないことを推奨する」でしょうか?「。。。にはエビデンスがあるから」「。。。をすることを推奨する」でしょうか?

エビデンスとはある・なしのどちらかでしょうか?さらに、益のエビデンスと害のエビデンスと両方考える必要があります。

US Preventive Task Force (USPSTF)は、推奨をA, B, C, D, Iに分類していることについて以前の投稿の中で述べました。この中で、Grade Cは”USPSTFは、専門家の判断と患者の好みPreferencesに基づいて、選択的に個人個人の患者に提供することを推奨する。正味の益が小さいことに少なくとも中等度の確実性がある”と定義されています。患者の好みPreferencesは患者の価値観と同義と考えてください。

Grade Iは”USPSTFは、現在のエビデンスがそのサービスの益と害のバランスを評価するのに不十分であると結論付ける。エビデンスはないか、貧弱か、あるいは矛盾しており、益と害のバランスを決められない”と定義されています。

益と害のバランスthe balance of benefits and harmsは正味の益the net benefitと同じ意味です。正味の益は、”The net benefit is defined as benefit minus harm of the preventive service as implemented in a general, primary care population. ” すなわち、その予防医療サービスが一般のプライマリケア集団で実行されるときの益ひく害が正味の益と定義される、と。ここでは益から害を減じた(引き算した)値を正味の益Net benefitと定義しています。

以上を前提に、Braithwaite RSの”EBM’s six dangerous words.” (文献)の意味を考えてみましょう。

“EBM’s six dangerous words.”とは”There is no evidence to suggest…”の6つの言葉のことです。つまり、「。。。を提案(示唆)するエビデンスはない」という表現のことです。

Braithwaite RSのこの論文における主張は、この表現は4つの意味でつかわれているので、そのどれなのかをわかるように最初からそれら4つの内のどれかの表現を使いましょうということです。

1.科学的エビデンスは決定的ではなく、どれが最善か分らない。(USPSTF Grade Iでベイジアン無情報事前分布の場合)
2.科学的エビデンスは決定的ではないが私の経験あるいはその他の知識は”X”を示唆する。(USPSTF Grade Iで”X”を示唆するベイジアン有情報事前分布の場合)
3.これは益がないことが証明されている(USPSTF Grade D)
4.これはどっちつかずで、ある患者には益が害を上回り、別の患者にはそうではない(USPSTF Grade C)

1の場合、USPSTFは、”臨床的考察のセクションを読み、もし、そのサービスを提供するのであれば、患者は益と害のバランスの不確実性を理解すべきである”とSuggestions for Practiceで述べています。すべきではないと決めつけているわけではありません。

2の場合は、1の場合と同様ですが、1と比べるとそのサービスが提供される可能性が高くなるでしょう。

1,2で事前分布Priorと言っているのは、Braithwaite RSです。USPSTFの記述にはありません。彼の考えは、その時点における仮説Hypothesisがあって、それが正しい確率P(H)が、その後データDataが得られるとその正しい確率P(H|D)はデータが正しい確率P(D)とその仮説が正しい時にそのデータが得られる確率P(D|H)によって決まるというベイズの定理の、P(H)のことです。P(H|D) = P(D|H)×P(H)/P(D)の式で表されます。

つまり、エビデンスが決定的でない、不確実性が高い場合でも、その程度は異なり、”私の経験あるいはその他の知識”の正しい確率=P(H)に相当する値は様々で、1の場合は、それが0に近い、2の場合は、もう少し大きいということになります。つまり、”今までの自分の経験や間接的なデータ、研究結果から、Xが有効の可能性が少しある”という場合と、”全くわからないが、Xはまず効果がある可能性は殆どゼロ”という場合では、判断が違ってきます。

3の場合は、害が益を上回る状態になります。だから、しない方がいい。

4の場合は、患者の価値観によって、ある患者にはすることになり、別の患者にはしなことになります。

とうことから、エビデンスがないからと言って、してはいけないという決断をすると多くの場合、間違った決断になってしまうでしょう。

臨床の現場では、何もしないという選択肢も含めて、どれかに決める必要があります。その際に、エビデンスがないからしない、という考え、また、診療ガイドラインにおいて、ランダム化比較試験がない領域では、推奨を作成することはできないという考えは、偏った考えではないでしょうか。

エビデンスの確実性は、All or nothingあるいは1か0かではありません。Quantitative Benefit-Risk Assessmentを行う際には、エビデンスの確実性を表すのに、確率分布を使います。以前の投稿、益と害の定量的評価法 Quantitative benefit-harm assessmentKeeney and RaiffaのSwing weightingを用いたMCDASwing weightingを用いたMCDAの結果、などを参照してください。

文献
Braithwaite RS: A piece of my mind. EBM’s six dangerous words. JAMA 2013;310:2149-50. doi: 10.1001/jama.2013.281996 PMID: 24281458

同じ論文が2020年に再掲されています。
Braithwaite RS: EBM’s Six Dangerous Words. JAMA 2020;323:1676-1677. doi: 10.1001/jama.2020.2855 PMID: 32369132

GoogleドキュメントでOCR

Googleドライブに置いた画像ファイル、つまり、文章の印刷物のスキャン画像、あるいは画面キャプチャ―した文章の画像のファイルを右クリックして、アプリで開く→Googleドキュメントを選択して開くとOCR機能が作動して、テキストに変換してくれるそうです。画像ファイルはJPEG、PENGいずれも大丈夫のようです。OCRはOptical Character RecognitionまたはReaderのことです。

実際にやってみましたが、そのまま正確にテキスト化してくれます。英語、日本語いずれもOKです。Google Chromeを起動して、Googleドライブを開き、これらの操作を行います。GoogleドライブにOCRのような名前のフォルダーを作って、そこへ画像ファイルをアップロードしておいて、操作すればいいと思います。カメラで撮影したファイルでもきれいに撮れていればテキスト化できるようです。

テキスト化したら、以前紹介したように、DeepLで翻訳することができます。

PubMed検索結果をGoogleスプレッドシートで処理する方法を紹介しましたが、Googleドキュメントもすごく進化してますね。

交絡因子Confounders

疫学Epidemiologyと臨床疫学Clinical Epidemiologyは同じではありません。前者の方が歴史が長く、非常に奥が深い領域です。Evidence-Based Medicine (EBM)に興味を持って、研究の内的妥当性の評価、いわゆる批判的吟味Critical appraisalを学んだとしても、疫学の奥深さにはなかなか到達できないと思います。

Rothman KJ, Greenland S, Lash TL: Modern Epidemiology (3rd ed.) 2008 Lippincott Williams & Wilkins. PA, USA.のは発刊されてから10年以上経っていますが、今でも非常に優れた疫学のテキストブックだと思います。このChapter 9. Validity in Epidemiologic Studies. Rothman KJ, Greenland S, Lash TLではValidity of Estimation推定値の妥当性、Confounding交絡、Selection Bias選択バイアス、Information Bias情報バイアス、Generalizability一般化可能性について書かれています。

交絡因子は曝露/介入ともアウトカムとも関連のある因子として認識されていると思います。例えば、飲酒者と非飲酒者で口腔癌の発症を比較する場合、飲酒する人は喫煙する人が多く、喫煙は口腔癌のリスクファクターであり、喫煙は飲酒と口腔癌発症発症の両方に関連があるため、交絡因子であり、飲酒の口腔癌発症への効果を歪めることになります。

Counterfactual反事実の対照を設定できない限り、対照群と暴露群の比較では交絡の影響を考慮することが必須だと言えます(最後の追加を見てください)。

Rothman KJらは上記の第9章で、交絡因子については3つの基準Criteriaがあることを述べています(図1)。

図1.交絡因子の3基準。

さらに、これらの3つの特徴が交絡因子の定義として誤解されることがあること、ここれらの基準が満たされても必ず交絡因子と言えるわけではないことを指摘しています。

アウトカムの原因となる外部因子と関連があり、その代理となりうる因子も交絡因子と呼ばれる。すなわち、代理交絡因子Surrogate confounderが単に交絡因子と呼ばれることも多いと述べられています。例えば、多くの研究で年齢が交絡因子として取り扱われていますが、年齢は代理交絡因子の代表的なものです。加齢によって起きる、細胞の変異の蓄積、組織の損傷の蓄積などが疾患発症(アウトカム)の原因であって、年齢自体が疾患発症を引き起こすわけではないということです。

この3条件についての彼らの記述をリストアップしてみます:

・交絡因子、代理交絡因子のいずれでも、交絡因子候補として扱っていいが、研究下の暴露のそのレベルで危険因子として作用するものでなければならない。
・データで認められる交絡因子候補とアウトカムの関連は交絡があるかどうかを見極めるガイドになるが、見かけ上の関連でなく、実際の関連でなければならない。
・交絡因子候補とアウトカムの関連を知るには外部のエビデンス、すなわち事前の知識Prior knowledgeが必要になり、特に小規模な研究の場合はそうである。
・しかしながら、外部のエビデンスの限界に注意が必要である。
・コホート研究では原集団Source populationは研究コホートになり、測定誤差が無ければ、研究コホートで暴露と関連のある因子は交絡因子と考えてよい。
・ランダム化比較試験であれば交絡が起きないとは言えない。小規模な試験の場合は大きくなりやすく、大規模な試験であっても介入のアドヒアランスが悪い場合、脱落が多い場合は交絡が起きやすい。
・症例対照研究では原集団の内、ケースとなる集団で、暴露と交絡因子の候補の関連があるはずである。対照群が十分大きく、選択バイアス・測定誤差が無ければ、研究データから交絡をチェックできるが、一般的には暴露と交絡因子の候補との関連を適切に推定できないかもしれない。(Bias analysisが必要)。
・交絡因子が暴露よりも先行Precedeしている。
・交絡因子がアウトカムより先行している。
・もし、交絡因子候補が暴露の結果であり、その結果がアウトカムに関連している場合=中間因子の場合、交絡因子として解析しないで、中間因子として解析する必要がある。
・3条件が満たされる交絡因子が同定できた場合でも他に未知の交絡因子があるかもしれない。
・未知の交絡因子は解析できない。
・未知の交絡因子の効果が混ざり合った結果がプラスマイナス0になることもありうる。
・条件によっては、未知の交絡因子の効果を暴露の効果と取り違える可能性もある。

さて、バイアスや交絡因子あるいは交絡という用語の使い方は使う人によってさまざまであることが指摘されています。Schwartz Sらはこの投稿の最後に示す論文で、Internal validity, Source population, Causal effect, Actual effect of exposure, Bias (i.e., invalidity)についての定義を示したのち、”Confounding, selection bias, and information bias are categories of bias thus defined. What unites them is their consequence—what they do to the study results. They each create noncomparability, which prevents the identification of the true causal effect the exposure had on the exposed in the source population.”「交絡、選択バイアス、情報バイアスは、このように定義されたバイアスのカテゴリーである。これらのバイアスをまとめているのは、その結果、すなわち研究結果に何をもたらすかということである。これらのバイアスはそれぞれ非比較可能性を生み出し、暴露が原集団の被暴露者に与えた真の因果関係を特定することを妨げる。」と述べています。

異なる視点、異なる分野での異なる考えなどを知ることがとても重要に思えます。

文献:
Rothman KJ, Greenland S, Lash TL: Modern Epidemiology (3rd ed.) 2008 Lippincott Williams & Wilkins. PA, USA.

Schwartz S, Campbell UB, Gatto NM, Gordon K: Toward a clarification of the taxonomy of “bias” in epidemiology textbooks.  2015;26:216-22. doi: 10.1097/EDE.0000000000000224 PMID: 25536455

追加:

効果測定値Measures of effect関連測定値Measures of association
集団と暴露以外は同じ反事実集団を比較する。集団と暴露を受けていない異なる人々の異なる集団を比較する。
効果effectと関連associationを使い分けています。本当の値と研究結果で得られた値と考えてもいいと思います。

2つの集団間の差が見られ、これら2つの測定値、すなわち効果測定値と関連測定値、が異なる場合、我々は、関連associationが交絡しているconfounded、または交絡が関連に存在していると言う。  これら2つの測定値が同じであれば、交絡は存在しないと言う。

交絡因子とは、関連性の測定値と、反事実counterfactulalの理想を用いて得られるであろう効果の測定値との間の差の全部または一部を説明するか、または作り出す因子(暴露、介入、治療など)である。