GoogleドキュメントでOCR

Googleドライブに置いた画像ファイル、つまり、文章の印刷物のスキャン画像、あるいは画面キャプチャ―した文章の画像のファイルを右クリックして、アプリで開く→Googleドキュメントを選択して開くとOCR機能が作動して、テキストに変換してくれるそうです。画像ファイルはJPEG、PENGいずれも大丈夫のようです。OCRはOptical Character RecognitionまたはReaderのことです。

実際にやってみましたが、そのまま正確にテキスト化してくれます。英語、日本語いずれもOKです。Google Chromeを起動して、Googleドライブを開き、これらの操作を行います。GoogleドライブにOCRのような名前のフォルダーを作って、そこへ画像ファイルをアップロードしておいて、操作すればいいと思います。カメラで撮影したファイルでもきれいに撮れていればテキスト化できるようです。

テキスト化したら、以前紹介したように、DeepLで翻訳することができます。

PubMed検索結果をGoogleスプレッドシートで処理する方法を紹介しましたが、Googleドキュメントもすごく進化してますね。

交絡因子Confounders

疫学Epidemiologyと臨床疫学Clinical Epidemiologyは同じではありません。前者の方が歴史が長く、非常に奥が深い領域です。Evidence-Based Medicine (EBM)に興味を持って、研究の内的妥当性の評価、いわゆる批判的吟味Critical appraisalを学んだとしても、疫学の奥深さにはなかなか到達できないと思います。

Rothman KJ, Greenland S, Lash TL: Modern Epidemiology (3rd ed.) 2008 Lippincott Williams & Wilkins. PA, USA.のは発刊されてから10年以上経っていますが、今でも非常に優れた疫学のテキストブックだと思います。このChapter 9. Validity in Epidemiologic Studies. Rothman KJ, Greenland S, Lash TLではValidity of Estimation推定値の妥当性、Confounding交絡、Selection Bias選択バイアス、Information Bias情報バイアス、Generalizability一般化可能性について書かれています。

交絡因子は曝露/介入ともアウトカムとも関連のある因子として認識されていると思います。例えば、飲酒者と非飲酒者で口腔癌の発症を比較する場合、飲酒する人は喫煙する人が多く、喫煙は口腔癌のリスクファクターであり、喫煙は飲酒と口腔癌発症発症の両方に関連があるため、交絡因子であり、飲酒の口腔癌発症への効果を歪めることになります。

Counterfactual反事実の対照を設定できない限り、対照群と暴露群の比較では交絡の影響を考慮することが必須だと言えます(最後の追加を見てください)。

Rothman KJらは上記の第9章で、交絡因子については3つの基準Criteriaがあることを述べています(図1)。

図1.交絡因子の3基準。

さらに、これらの3つの特徴が交絡因子の定義として誤解されることがあること、ここれらの基準が満たされても必ず交絡因子と言えるわけではないことを指摘しています。

アウトカムの原因となる外部因子と関連があり、その代理となりうる因子も交絡因子と呼ばれる。すなわち、代理交絡因子Surrogate confounderが単に交絡因子と呼ばれることも多いと述べられています。例えば、多くの研究で年齢が交絡因子として取り扱われていますが、年齢は代理交絡因子の代表的なものです。加齢によって起きる、細胞の変異の蓄積、組織の損傷の蓄積などが疾患発症(アウトカム)の原因であって、年齢自体が疾患発症を引き起こすわけではないということです。

この3条件についての彼らの記述をリストアップしてみます:

・交絡因子、代理交絡因子のいずれでも、交絡因子候補として扱っていいが、研究下の暴露のそのレベルで危険因子として作用するものでなければならない。
・データで認められる交絡因子候補とアウトカムの関連は交絡があるかどうかを見極めるガイドになるが、見かけ上の関連でなく、実際の関連でなければならない。
・交絡因子候補とアウトカムの関連を知るには外部のエビデンス、すなわち事前の知識Prior knowledgeが必要になり、特に小規模な研究の場合はそうである。
・しかしながら、外部のエビデンスの限界に注意が必要である。
・コホート研究では原集団Source populationは研究コホートになり、測定誤差が無ければ、研究コホートで暴露と関連のある因子は交絡因子と考えてよい。
・ランダム化比較試験であれば交絡が起きないとは言えない。小規模な試験の場合は大きくなりやすく、大規模な試験であっても介入のアドヒアランスが悪い場合、脱落が多い場合は交絡が起きやすい。
・症例対照研究では原集団の内、ケースとなる集団で、暴露と交絡因子の候補の関連があるはずである。対照群が十分大きく、選択バイアス・測定誤差が無ければ、研究データから交絡をチェックできるが、一般的には暴露と交絡因子の候補との関連を適切に推定できないかもしれない。(Bias analysisが必要)。
・交絡因子が暴露よりも先行Precedeしている。
・交絡因子がアウトカムより先行している。
・もし、交絡因子候補が暴露の結果であり、その結果がアウトカムに関連している場合=中間因子の場合、交絡因子として解析しないで、中間因子として解析する必要がある。
・3条件が満たされる交絡因子が同定できた場合でも他に未知の交絡因子があるかもしれない。
・未知の交絡因子は解析できない。
・未知の交絡因子の効果が混ざり合った結果がプラスマイナス0になることもありうる。
・条件によっては、未知の交絡因子の効果を暴露の効果と取り違える可能性もある。

さて、バイアスや交絡因子あるいは交絡という用語の使い方は使う人によってさまざまであることが指摘されています。Schwartz Sらはこの投稿の最後に示す論文で、Internal validity, Source population, Causal effect, Actual effect of exposure, Bias (i.e., invalidity)についての定義を示したのち、”Confounding, selection bias, and information bias are categories of bias thus defined. What unites them is their consequence—what they do to the study results. They each create noncomparability, which prevents the identification of the true causal effect the exposure had on the exposed in the source population.”「交絡、選択バイアス、情報バイアスは、このように定義されたバイアスのカテゴリーである。これらのバイアスをまとめているのは、その結果、すなわち研究結果に何をもたらすかということである。これらのバイアスはそれぞれ非比較可能性を生み出し、暴露が原集団の被暴露者に与えた真の因果関係を特定することを妨げる。」と述べています。

異なる視点、異なる分野での異なる考えなどを知ることがとても重要に思えます。

文献:
Rothman KJ, Greenland S, Lash TL: Modern Epidemiology (3rd ed.) 2008 Lippincott Williams & Wilkins. PA, USA.

Schwartz S, Campbell UB, Gatto NM, Gordon K: Toward a clarification of the taxonomy of “bias” in epidemiology textbooks.  2015;26:216-22. doi: 10.1097/EDE.0000000000000224 PMID: 25536455

追加:

効果測定値Measures of effect関連測定値Measures of association
集団と暴露以外は同じ反事実集団を比較する。集団と暴露を受けていない異なる人々の異なる集団を比較する。
効果effectと関連associationを使い分けています。本当の値と研究結果で得られた値と考えてもいいと思います。

2つの集団間の差が見られ、これら2つの測定値、すなわち効果測定値と関連測定値、が異なる場合、我々は、関連associationが交絡しているconfounded、または交絡が関連に存在していると言う。  これら2つの測定値が同じであれば、交絡は存在しないと言う。

交絡因子とは、関連性の測定値と、反事実counterfactulalの理想を用いて得られるであろう効果の測定値との間の差の全部または一部を説明するか、または作り出す因子(暴露、介入、治療など)である。

DeepL翻訳

DeepLというドイツの企業が開発したAIを使った自動翻訳がいろいろな分野で話題になっています。ウェブページで使えるものもあり、PCにダウンロードして使えるものもあります。翻訳したいテキストの範囲をコピーして貼り付けるか、Word(.docx)またはPowerPoint(.pptx)形式のファイルをドラッグ&ドロップして翻訳してくれます。複数の言語に対応しており、日本語から英語、英語から日本語もあっという間に翻訳してくれます。

文字数の制限がありますが、無料で使えます。有料版に登録すると文字数の制限がないだけでなく、辞書登録などもできるようです。

WindowのPCでダウンロードして使ってみました。インストールはほかのソフトウェアと同じです。翻訳したいテキストの範囲をコピーして、Ctrキーを押しながら、Cを2回続けて押します。つまり、通常のコピー操作のあとすぐCをもう一度押します。すると、自動的にDeepLが起動して、翻訳が行われ、右側のフィールドに翻訳が表示されます。原文の英語・日本語の判定は自動でしてくれます。翻訳された文章をクリックするとどの部分の翻訳ががわかるように文字に色が付きます。

ためしに、前回の投稿をDeepLで翻訳した結果はこうです。ほぼ問題ないレベルです。

In my previous post, “Using Excel for literature management and selection tasks”, I mainly discussed using Microsoft Excel, but you can also do the same thing with Google Spreadsheets. You can open files created in Excel right into a Google Spreadsheet, and it may also work on a Chrome Book, iPad or Android OS tablet.

You can use OneDrive, Google Drive, DropBox, and other cloud services to share files and allow multiple people to work together, but the method I’m going to show you might be better suited for collaborative work.

I’ve made a video explaining it. There’s no audio, and the instructions come in tickers

PubMedで検索結果のAbstractをいくつか英語から日本語に翻訳してみましたが、100%正確とは言いませんが、非常に精度が高いです。日本語から英語への翻訳でも、英語から日本語への翻訳でも元の文章の構成が単純で、わかりやすいほど精度は高くなるようです。

信頼できる診療ガイドライン作成とCOI

全米科学アカデミー医学研究所Institute of Medicine (IOM, 現全米医学アカデミーNational Academy of Medicine, NAM) は2011年に”Clinical Practice Guidelines We Can Trust“を発表しています。まさに「信頼できる診療ガイドライン」です。

その中で、”第4章 信頼できる診療ガイドライン作成のための現在最善の方法とスタンダードの提言:パート1 作業の開始”でConflict of Interest (COI)利益相反に関するスタンダードが述べられています。

COIの申告、開示、管理は診療ガイドライン作成の過程の透明性確保のために必須であり、その目的は信頼できる診療ガイドラインを作成することです。この第4章はCOIに限定した議論ではなく、信頼できる診療ガイドラインを作成するために必須の事項の一つとして、COIの申告、開示、管理を位置付けています。COIについてはGuidelines International Network (G-I-N)も声明を発表していますが、こちらはCOIが中心の声明で、9つの原則について述べています。日本医学会からは「日本医学会診療ガイドライン策定参加資格基準ガイダンス2017年 」が発表されておりCOIについて詳しく述べられています。

COIは経済的COIだけではなく、知的COI Intellectual COIも問題になります。American Heart Association/the American College of Cardiology (ACC/AHA)その他9つの学会から2017年に出された高血圧の診療ガイドラインに対し、アメリカ家庭医学アカデミーは、作成プロセスの問題、より低い目標血圧によるベネフィットがわずかなことから支持しないことを決定したそうです(Miyazaki K 2018)。特に知的COIの問題、すなわちSPRINT試験の代表がガイドラインパネルの議長を務めたことが問題視されています。

IOMの”第4章 信頼できる診療ガイドライン作成のための現在最善の方法とスタンダードの提言:パート1 作業の開始”のまとめの項は以下の通りです。

  1. 透明性の確保
    1.1 CPG (Clinical Practice Guideline)の作成と資金調達の過程は明確、詳細で公衆がアクセスできるようにすべきである。
  2. 利益相反(COI)の管理
    2.1 ガイドライン作成グループ(GDG, Guideline Development Group)の選任に先立ち、参加を考慮中の個人は作成グループの活動との間でCOIを生じうるすべての利益と活動を招集者に書面で申告すべきである。
    ・申告は現在の、そして計画されている、CPGの想定されるスコープに関連する商業的(そこから収入のかなりの部分を得ている業務・サービスも含む)、非商業的、知的、患者‐公衆に関する活動のすべてを反映すべきである。
    2.2 GDG内でのCOIの申告:
    ・GDGメンバーのすべてのCOIはその仕事を開始する前に報告され、これから形成されるであろう作成グループによって議論されるべきである。
    ・各パネルメンバーはそのCOIが診療ガイドライン作成プロセスあるいは個別推奨にどのように影響しうるかを説明すべきである。
    2.3 (株式などの)処分
    ・GDGメンバーは各自および家族が保有する経済的投資を自ら売却・処分すべきで、その利益が診療ガイドラインの推奨により影響を受けうる企業体のマーケティングあるいはアドバイザリーボードに参加すべきではない。
    2.4 適用除外Exclusions
    ・可能な限りGDGメンバーはCOIを有するべきではない。
    ・いくつかの状況では、メンバーは診療ガイドラインに関連のあるサービスから収入のかなりの部分を得ている関連のある臨床専門家のような、COIを有するメンバーなしで、その仕事を遂行できないかもしれない。
    ・COIを有するメンバーはGDGの少数派にとどめるべきである。
    ・ 議長あるいは副議長はCOIを有する者であってはならない。
    ・資金提供者はCPG作成で何らかの役割を持ってはならない。
  3. ガイドライン作成グループの構成
    3.1 GDGは方法論の専門家、臨床家、そして診療ガイドラインで影響を受けるであろう集団などさまざまな人々から構成され、多くの専門分野のバランスがとれた構成にすべきである。
    3.2 患者と市民の参画は現在の患者あるいは疾患経験者、患者支援者あるいは患者・医療利用者団体の代表者をGDGに含むことで(少なくともクリニカルクエスチョン作成時点と診療ガイドライン草稿のレビューの時点で)強化すべきである。
    3.3 エビデンスの批判的吟味のトレーニングを含む、患者と医療利用者の代表の効果的な参加を増やす戦略がGDGにより採用されるべきである。
  4. 診療ガイドライン-システマティックレビューの交差(Intersection)
    4.1 診療ガイドライン作成者はInstitute of Medicineの比較効果研究のシステマティックレビューのスタンダードにより設定された基準を満たすシステマティックレビューを用いるべきである。
    4.2 システマティックレビューが特定のガイドラインに情報を与えるために特異的に実施される時は、GDGとシステマティックレビューチームは両者のスコープ、アプローチ、そしてアウトプットについて協働すべきである。

COIのことだけを論じるのではなく、いかに透明性を確保し、いかに信頼できる診療ガイドラインをつくるかという観点で議論することが重要ではないかと思います。