文献数が多い場合のAIによるPICO要約表作成:Geminiで

前の投稿で、Google NotebookLMで、PubMed検索結果をAbstract (text)形式でテキストファイルとしてダウンロードしそれを400件ずつのテキストファイルに分割しソースとしてアップロードして、PICO要約表の作成ができることを、解説しました。その際は、ソースファイルを1つずつ選択して、文献選定とPICO要約表の作成のためのプロンプトを実行した後、更新をしてから、次のソースファイルで同じことを繰り返し処理させることで、1894件の文献ソースから採用基準・除外基準に合致するランダム化比較試験が11件に絞られ、標的文献9件をすべて選定できました。

NotebookLMでは分析対象のソースファイルにチェックを入れることで、1つのソースファイルを選んでプロンプトを実行することができるので、操作を連続してスムーズに進めることができるのがGeminiに対する利点と言えます。

今回、Geminiではどうか試してみることにしました。Google Workspace Business Standardを契約しているので、100万トークン(英語ワードで約75万語)まで処理できます。(無料版では3.2万トークンまでなので、残念ながら同じことをするのは無理です。)Gemini 3ではなく、Gemini PRO 2.5 高速モードを使いました。

Geminiの場合も左上のチャットを新規作成をクリックして毎回更新してから、それぞれのAbstract (text)形式のテキストファイルをアップロードして、それに続けて以下のプロンプトを実行します。

ソースのテキストファイルから、以下の採用基準と除外基準に合致する文献を抽出して、Study ID、P、I、C、O、コメント、PMIDの7列からなるテーブルを作成してください。P,I,C,O,コメントは原則日本語で記述してください。研究は年度の新しい順に並べ、Googleスプレッドシートへエクスポートできるテーブルとして提示してください。
Study IDは第一著者の姓のフルスペル+半角スペース+イニシャル+半角スペース+年度を記述してください。著者名が複数の場合et al.を付ける必要はありません。
Pの欄は対象者に関する記述(症例数)、Iの欄は介入に関する記述(症例数)、Cの欄は対照の治療に関する記述(症例数)、Oの欄は測定されたアウトカムの内容を記述してください。
コメント蘭は介入の効果の概略を記述してください。
PMIDの欄はhttps://pubmed.ncbi.nlm.nih.gov/PMID/のように、クリックしたらPubMedの該当する文献を開けるようなリンクのURLを記述してください。URLの最後は/で閉じてください。"PMID"は不要で、URLだけを記述してください。
P, I, C, Oの欄は他の研究との違いが分かる程度の詳細な情報を含めてください。
単位の表記はLaTex記法を使わないでテキストで表示してください。

採用基準:
研究デザインはランダム化比較試験。
対象は肝細胞癌患者。
介入がタモキシフェン単独投与。
対照がプラセボあるいは無治療あるいは保存的治療。
生存をアウトカムとして分析。
除外基準:
システマティックレビュー/メタアナリシスの論文。
対照が肝動脈塞栓療法や化学塞栓療法の研究。
対照でタモキシフェンが投与されている研究。
アウトカムとして生存が分析されていない研究。

まず、左サイドバーのチャットを新規作成の部分をクリックして、チャットを新規作成します。

ソースファイルをチャットエリアにドラグアンドドロップして読み込ませてから、プロンプトを書き込んで、実行します(Enterキーまたは>ボタンをクリック)。

回答では、ファイル1からは該当する文献はありませんでしたが、システマティックレビュー/メタアナリシスの論文(今回基準としたNaing C 2024)があることを述べています。

ここで、プロンプトを実行後、左のサイドバーにプロンプトの履歴が現れますので、左サイドバーの一番上のチャット名を選択して、削除します。なお、左サイドバーのチャットの一覧では、右側に内容が表示されているチャットはハイライトされていますので、削除したいファイルの内容を確認できます。

チャットを削除しますかの確認画面で削除をクリックします。

再度、チャットを新規作成し、ファイル2をアップロードして、同じプロンプトを実行します。”該当する文献は見つかりませんでした”と回答が提示され、各文献で使用されていた薬剤名の一覧が表示されました。

ファイル2のチャットの履歴も削除して、チャットを新規作成し、ファイル3をアップロードして、同じプロンプトを実行します。”該当する文献は見つかりませんでした”と回答が提示され、評価された薬剤名に関する言及と、参考情報として、”なお、ソーステキストには、タモキシフェンに関する以下の言及が含まれており、HCC治療における役割が否定されています。タモキシフェンはHCCの治療において役割がないと結論づけられた 。HCCの治療としてタモキシフェンは役割がないという言及がある 。”と記述されていました。このような情報も有用かと思います。

ファイル3のチャットの履歴も削除して、チャットを新規作成し、ファイル4をアップロードして、同じプロンプトを実行します。2件の文献が選定され、いずれも標的文献に含まれていた文献でした。

PMIDのリンクが有効なので、クリックするとPubMedの該当論文のアブストラクトがブラウザで表示されます。ここで、採用基準に合致していることを確認することもできます。まずはすべての文献をスプレッドシートに貼り付けようと思います。表の部分ではなく、左下のコピー用のボタンをクリックして、Googleスプレッドシートに貼り付けます。Excelにも貼り付けられます。どちらも、体裁を整える必要がありますが、まずは不要な行を削除して、左上上角をクリックして、シート全体を選択してから、フォントサイズを11か10に変更し、表示形式のメニューから配置を左、上、そしてラッピングから折り返すを選択し、列幅も調整します。一か所LaTex記法の表示が残っていたのでマニュアルで変更しました。

ファイル4のチャットの履歴も削除して、チャットを新規作成し、ファイル5をアップロードして、同じプロンプトを実行します。9件の文献が選定されましたが、年度の新しい順になっていなかったので、そのまま続けて、プロンプト”表を年度の新しい順に並べ替えてください。”を実行してみましたが、一文献だけ順序がずれていたので、全部をGoogleスプレッドシートに貼り付けてから、並べ替えることにしました。

ファイル4と5から計11件の文献が選定され、基準としてNaing C 2024のコクランシステマティックレビューで採用論文として選定されていた9件はすべて含まれていました。スプレッドシートで作成したPICO要約表を図として以下に示します。Study IDのシアンで色を付けてある文献が標的文献です。

400文献ずつに分割してプロンプト実行ごとに履歴を削除して新規チャットとして繰り返し実行した場合は、漏れなく必要な文献が選定されました。追加されたPerrone F 2002はCLIP Group 1998で報告された試験と同じ内容で後で報告されたものでした。Farinati Fの1990と1992の2件は同じ研究なのかどうかをチェックする必要があります。

今回の検討からは、Gemini PRO 2.5 高速モードでも、小さいファイルに分割して、一つ一つ新規チャットにして選定作業を行えば、十分実用的なレベルで文献の一次選定とPICO要約表を作成できそうなことが分かりました。

なお、ファイル4と5の単語数は合計約19万です。この2つのファイルをアップロードして同じプロンプトを実行したところ、結果は11件で基準に合致しない文献が4件含まれていました。さらにファイル3,4,5を合わせると32万語になり、アップロードできないというメッセージがでました。やはり、一度に処理するテキストの容量に限度があるようです。

また、Copilot (GPT-5)で、ファイル4をアップロードして同じプロンプトを実行したところ、5件が選定され、1件は非適格文献で、400件程度の文献数ではうまく処理できないようでした。

今回は400件ずつに分割してファイルひとつずつ選定作業を行えば、Geminiでも文献の一次選定とPICO要約表の作成が出来そうなことが分かりました。

大きなサイズのAbstract (text)形式のテキストファイルを分割する方法については、前回の投稿を参照してください。

文献数が多い場合のPICO要約表作成:NotebookLMで

前の投稿で文献数が90件の場合、PubMedで検索結果をAbstract (text)形式でテキストファイルとしてダウンロードしたファイルをNotebookLMでソースとしてアップロードして、PICO要約表を作成できることを示しました。今回は、1894件の文献を含むテキストファイルで一つのファイルとしては、約5MB、約70万語の大きなファイルを分割したテキストファイルを作成し、それらをNotebookLMのソースにまとめてアップロードして、1つのファイルごとにプロンプトを実行してPICO要約表を作成して、漏れなく文献の一次選定ができるかを検討してみました。基準としては前回と同じくNaing C 2024のコクランシステマティックレビューで採用された9文献:Barbare JC 2005、Chow PK 2002、Liu CL 2000、CLIP Group 2000、Riestra S 1998、Castells A 1995、Martínez Cerezo FJ 1994、Elba S 1994、Farinati F 1990を標的文献としました。

PubMedの検索式は以下の通りです。検索結果をAbstract (text)形式でテキストファイルとしてダウンロードしました。この中に9件の標的文献が含まれていることは確認してあります。

(hepatocellular carcinoma[tw] OR carcinoma,hepatocellular[mh]) AND (drug therapy[mh] OR "Antineoplastic Agents" [Pharmacological Action]) AND (english[la] OR japanese[la]) AND (randomized controlled trial [pt] OR controlled clinical trial [pt] OR randomized [tiab] OR placebo [tiab] OR clinical trials as topic [MeSH:noexp] OR randomly [tiab] OR trial [ti] NOT(animals [mh] NOT humans [mh]))

1894件で70万語ではNotebookLMの1ファイルの容量制限を超えているので、文献数400件ずつに分割した5つのテキストファイルを用意しました。その作成方法については後述します。単語数が約7万から22万のファイルになりました。

用いたプロンプトは以下のものです。除外基準の記述の部分をGeminiに用いたものと少し変更しています。こちらの方がより論理的な記述だと思います。

ソースのテキストファイルから、以下の採用基準と除外基準に合致する文献を抽出して、Study ID、P、I、C、O、コメント、PMIDの7列からなるテーブルを作成してください。P,I,C,O,コメントは原則日本語で記述してください。研究は年度の新しい順に並べ、Googleスプレッドシートへエクスポートできるテーブルとして提示してください。
Study IDは第一著者の姓のフルスペル+半角スペース+イニシャル+半角スペース+年度を記述してください。著者名が複数の場合et al.を付ける必要はありません。
Pの欄は対象者に関する記述(症例数)、Iの欄は介入に関する記述(症例数)、Cの欄は対照の治療に関する記述(症例数)、Oの欄は測定されたアウトカムの内容を記述してください。
コメント蘭は介入の効果の概略を記述してください。
PMIDの欄はhttps://pubmed.ncbi.nlm.nih.gov/PMID/のように、クリックしたらPubMedの該当する文献を開けるようなリンクのURLを記述してください。URLの最後は/で閉じてください。"PMID"は不要で、URLだけを記述してください。
P, I, C, Oの欄は他の研究との違いが分かる程度の詳細な情報を含めてください。
単位の表記はLaTex記法を使わないでテキストで表示してください。

採用基準:
研究デザインはランダム化比較試験。
対象は肝細胞癌患者。
介入がタモキシフェン単独投与。
対照がプラセボあるいは無治療あるいは保存的治療。
生存をアウトカムとして分析。
除外基準:
システマティックレビュー/メタアナリシスの論文。
対照が肝動脈塞栓療法や化学塞栓療法の研究。
対照でタモキシフェンが投与されている研究。
アウトカムとして生存が分析されていない研究。

5つのテキストファイルをアップロードした状態では、全体の概略が中央に提示されています。通常すべてのソースが選択された状態になっていますが、ここで、分析対象のファイルのひとつだけにチェックを入れて、チャットエリアに上記プロンプトをコピー・貼り付けし、エンターキーを押すか>ボタンをクリックします。

最初はファイル1を選択しています。1分もかからないで、回答が提示され、該当する文献はないという回答でした。この時点では、上の中央右のあたりに、チャットのパネルに更新ボタンが出ているので、それをクリックして、更新し、ファイル1のチェックをはずし、ファイル2を選択して、クリップボードに残っている、プロンプトをチャットエリアに貼り付け、新たにまたプロンプトを実行します。

更新→次のファイルの選択→同じプロンプトを実行を繰り返していきます。PICO要約表が提示されたら、Googleスプレッドシートで空白のスプレッドシートを開き、表の内容をドラグして選択し、貼り付けます。また、チャットエリアのすぐ上にメモに保存のボタンが出るので、右のStudioの方に回答を保存しておけば、後で、表データを利用することもできます。

これで計10件の文献が選定されました。基準の文献リストのCLIP Group 2000が含まれていないのですが、実はこの論文と同じ内容の時間的に後で発表された論文がPerrone F 2002の論文でしたのでAIはこちらを選定したようです。

Farinati F 1992は基準の文献リストには含まれていなかったので、 Farinati F 1990と2つの異動は別にして、1件プラスされていたことになります。PICO要約表を以下に図として示します。

今回の検討から、NotebookLMの場合、文献数400程度のテキストファイルに分割して、1つずつ更新しながらプロンプトを実行すると、漏れなく、正確度も高く、文献選定ができそうなことが分かりました。なお、すべてのファイルを選択して、あるいは例えばファイル4,5の2つを選択してプロンプトを実行すると漏れが生じ、同じ結果は得られませんでした。

さて、Abstract (text)形式のテキストファイルの分割方法ですが、Divide PubMed Abstract (text) Fileというウェブツールを作成しました。URL: https://stat.zanet.biz/sr/div-pubmed-abstract.htm を開いて、元のテキストファイルをドラグアンドドロップすると、400件ずつのファイルに分割し、ファイル名をクリックするとファイルをダウロードできます。ファイル名には文献数を含めてありますが、当然のことながら最後のファイルは400より少ない文献数になります。

分割したファイルをZIPファイルにまとめたファイルもダウンロードできるので、こちらであれば1回のダウンロードで済むので通常はこちらを使い、ダウンロードしたZIPファイルの中身のすべてのファイルを外に出して使えばいいと思います。NotebookLMのソースにアップロードする際は、すべてのファイルを選択していっぺんにアップロードすればいいです。そして、上記のプロンプトを使って1ファイルずつ処理してみて下さい。

このウェブツールでは分割の単位を任意に設定出来ます。500件、300件、200件、100件ずつに分割することも試してみましたが、400件で十分なようです。

今後、様々な例で性能を試す必要があるでしょう。今後Gemini 3を試してみる必要もあるかもしれません。少し試した感じでは、あまり結果には差がありませんでした。また、コンテンツを知らなくても、機械的な操作だけで選定が可能なので、PubMedからダウンロードしたAbstract (text)形式テキストファイルを渡して、誰かに選定作業をしてもらい、マニュアルでの選定結果と比較することも考えられます。また、AIの機能には揺れがあるようで、タイミングによって、結果が変動する可能性があり、プロンプトの指示通りにならないこともあり、同じ対象ファイルで数人が同じプロンプトを実行して、まとめるというやり方も考えられます。プロンプトの書き方と対象ファイルの大きさの影響が大きいと感じました。プロンプトの指示通りにならなかった時、続けて修正の指示をプロンプトで書いて実行するとうまくいく場合もありますがそうならない時もありました。

NotebookLMやGeminiでの選定作業とスプレッドシートに結果を移す作業は非常に短時間で気楽にでき、極めて短時間で済みます。

文献:
Naing C, Ni H, Aung HH: Tamoxifen for adults with hepatocellular carcinoma. Cochrane Database Syst Rev 2024;8:CD014869. doi: 10.1002/14651858.CD014869.pub2 PMID: 39132750

NotebookLMでPICO要約表を作成する

Google NotebookLMではテキストファイル、PDFファイル、ウェブページのURL、YouTubeの動画のURLなどをソースとしてアップロードして、それに対してAIで概要を作成したり、音声解説や動画解説を作成したり、レポートを作成したり、インフォグラフィックやスライドを作成したりすることができます。

NotebookLMのソースとしてテキストファイルをアップロードする場合、1ソースあたり単語として最大50万語、200MB、1ノートブックあたり、ソース数50個、ファイルサイズ、単語数は制限なしで、しかもタイプの異なるソースをアップロードすることができます。

今回は、ここに、PubMedから、検索結果をAbstract (text)形式でダウンロードしたテキストファイルをソースとしてアップロードして、SR/MAにおける文献の一次選定をAIでできるか試してみようということです。肝細胞癌患者に対するTamoxifenの生存に対する効果を分析したランダム化比較試験のPICO要約表を作成することをNotebookLMでやってみたところ、あっという間に表が作成できました。

Cochrane systematic reviewのひとつである、Naing C 2024の論文を基準として、用い、CQは「手術不能の肝細胞癌患者にタモキシフェンによる薬物療法はプラセボまたは同等の治療と比べ生存を改善するか?」です。P:肝細胞癌患者、I:タモキシフェン投与、C: プラセボ・無治療・保存的治療のみ、O: 生存

Naing C 2024の論文では文献検索の対象期間は1990年から2024年3月26日になっています。以下の9件の論文が採用されていました。これらと同じ文献をAIが見つけ出して、PICO要約表を作成できるでしょうか?Barbare JC 2005、Chow PK 2002、Liu CL 2000、CLIP Group 2000、Riestra S 1998、Castells A 1995、Martínez Cerezo FJ 1994、Elba S 1994、Farinati F 1990

今回用いた検索式は以下の通りで、CochraneのRCT用の感度最大検索フィルターを用いています。これで、90件の文献が引き出されました。

(carcinoma,hepatocellular[mh] OR hepatocellular carcinoma[tw]) AND (tamoxifen[mh] OR tamoxifen[tw]) AND humans[mh] AND (english[la] OR japanese[la]) AND hasabstract[tw] AND (randomized controlled trial [pt] OR controlled clinical trial [pt] OR randomized [tiab] OR placebo [tiab] OR drug therapy [sh] OR randomly [tiab] OR trial [tiab] OR groups [tiab])

検索結果をAbstract (text)形式でダウンロードしたテキストファイルのファイルサイズは、189KBで単語数は約2.6万、文字数は19.4万でした。小さめのファイルで、分割する必要はなく、そのままNotebookLMにソースとしてアップロードできます。(なお、あらかじめこの検索結果に上記の9つの文献が含まれていることは確認しておきました。)

アップロードすると、以下の様な概要がAIによって書き出されますが、これも有用な情報だと思います:
「原典群は、主に進行性肝細胞がん(HCC)に対する治療戦略、特にホルモン療法であるタモキシフェンの役割について広範な臨床的評価とシステマティックレビューの結果を提示しています。かつて、HCC組織におけるホルモン受容体の発現や疾患の男性優位性に基づきタモキシフェンが有望視されましたが、その治療効果については初期の段階から見解が分かれていました。しかし、複数の大規模な無作為化比較試験(RCT)および更新されたコクラントレビューは、切除不能なHCC患者の全生存期間の延長に対するタモキシフェンの効果はほとんど、あるいは全くないと結論づけています。この一貫した否定的証拠に基づき、タモキシフェンや抗アンドロゲン療法はHCCの標準治療とは見なされていません。研究では、タモキシフェンがもし作用するとすれば、エストロゲン受容体とは独立した経路や高用量での使用が関連している可能性が指摘されており、シスプラチンやドキソルビシンなどの他の化学療法も単剤での有効性には限界があることが示されています。さらに、これらの文書は、HCCの予後を評価する際にCLIPスコアなどのステージングシステムが重要な役割を果たすことを強調しています。」

そして、NotebookLMで以下のプロンプトを実行しました。このプロンプトは雛形として、採用基準・除外基準を書き換えて、他の場合でも使えると思います。

ソースのテキストファイルから、以下の採用基準と除外基準に合致する文献を抽出して、Study ID、P、I、C、O、コメント、PMIDの7列からなるテーブルを作成してください。P,I,C,O,コメントは原則日本語で記述してください。研究は年度の新しい順に並べ、Googleスプレッドシートへエクスポートできるテーブルとして提示してください。
Study IDは第一著者の姓のフルスペル+半角スペース+イニシャル+半角スペース+年度を記述してください。
Pの欄は対象者に関する記述(症例数)、Iの欄は介入に関する記述(症例数)、Cの欄は対照の治療に関する記述(症例数)、Oの欄は測定されたアウトカムの内容を記述してください。
コメント蘭は介入の効果の概略を記述してください。
PMIDの欄はhttps://pubmed.ncbi.nlm.nih.gov/PMID/のように、クリックしたらPubMedの該当する文献を開けるようなリンクのURLを記述してください。
P, I, C, Oの欄は他の研究との違いが分かる程度の詳細な情報を含めてください。

採用基準:
研究デザインはランダム化比較試験。
対象は肝細胞癌患者。
介入がタモキシフェン。
対照がプラセボあるいは無治療あるいは保存的治療。
生存をアウトカムとして分析。
除外基準:
システマティックレビュー/メタアナリシスの論文は除外する。
対照が肝動脈塞栓療法や化学塞栓療法の研究は除外する。
アウトカムとして生存が分析されていない研究は除外する。

結果は、表として提示され、文献のURLも有効で、クリックするとPubMedのその文献のアブストラクトがブラウザで表示されますので、内容を確認するのも簡単にできます。得られた結果はコピーしてGoogleスプレッドシートに貼り付け、最初の2行を削除しタイトルと、文献リストの部分だけにしました。画像として以下に示します。

11行目のFarinati F 1992はNaing C 2024の採用論文に含まれていませんでしたが、それ以外はすべて同じ論文が選ばれていました。

この結果からは、SR/MAにおける、文献の一次選定をNotebookLMでやらせれば、簡単に、あっという間にできそうだということになります。

概要を読んで全体を理解し、一次選定した論文の全文を入手して、バイアスリスク評価、非直接性の評価を行い、効果指標の値を抽出し、メタアナリシスを行うわけですが、スピードアップが図れることは間違いないようです。

PubMedのAbstract (text)形式でテキストファイルとしてダウンロードした場合、500件の文献で単語数は15~20万語くらいになり、1000件では約40万語ぐらいになるので、それを超える場合は、ファイルを分割する必要があるでしょう。今回は、90件の文献から10件が選定されましたが、今後、もっと文献数が多い場合も一次選定がうまくできるか試す価値はあると思います。

扱えるコンテキストウインドウの大きさ、トークン(AIの処理する情報の単位、前の投稿を参照)を考えると、GeminiよりもNotebookLMの方がPICO要約表の作成には適していると思います。PubMedでのAbstract (text)形式でテキストファイルとしてダウンロードする方法についても前の投稿を参照してください。

Google GeminiでPubMed Abstract (text)ファイルから臨床に必要な情報を引き出せるか?

前回の投稿で、PubMed検索の結果をテキストファイルとしてダウンロードする際に、FormatをAbstract (text)にして、アブストラクト情報を含める方法を解説しました。タイトルとアブストラクトにはその論文の最も重要な情報が含まれており、特定のクエスチョンに対して回答を得るのに十分な場合も多いと思います。今回は、GoogleのAIであるGeminiを用いて自分が知りたい情報を引き出せるかを試してみます。GeminiのバージョンはGemini 2.5 Flashです。

知りたい情報とは、例えば、すべての論文をまとめた概略、特定の疑問に対する回答、今まで分析された治療薬の一覧、ランダム化比較試験の対象者の属性、採用基準・除外基準に合致するランダム化比較試験のPICOと効果の要約、などいろいろあるでしょう。

今回は、前回用意した大腸憩室炎に対するランダム化比較試験218件のアブストラクトの情報から臨床に必要な情報を引き出せるか試してみますが、Abstractを含むテキストファイルはかなりの大きさになるので、まずGeminiで扱える情報の大きさを調べてみましょう。

AIでは、取り扱える情報の単位をトークンと呼び、Google Geminiの無料版の場合、1チャットあたり3.2万トークンに制限されています。この制限はコンテキストウインドウと呼ばれます。英語の場合、1トークンは約0.75ワード、日本語の場合は約0.6ワードに相当するそうです。従って、英語の場合32000×0.75=24,000語、2.4万語が限界ということになります。この容量はプロンプトや回答の分も含め、また、続けてプロンプトを実行させる場合はそれらとそれらのプロンプトと回答も含めるということなので、解析対象のテキストファイルのワード数はもっと少なくする必要があります。Geminiで左上にあるチャットを新規作成をクリックして新たにチャットを開始するまでは、加算されていきますので、一連のプロンプトを実行する場合かなり余裕を持って小さめのファイルにする必要があり、PubMed検索結果を対象にするような場合は、無料版のGeminiでは実用的なレベルで使用するのは難しいでしょう。

Googleの提供するNotebookLMでは、アップロードした情報ソースに対してAIで処理ができ、テキストファイルもアップロードできます。1ソースあたり、200MB、50万語、1ノートブックあたり、ソース数50個、ファイルサイズ・単語数は制限なしなので、NotebookLMを使って、同じことができる可能性がありますが、今回はGeminiを使ってやってみます。

今回の大腸憩室炎に対するランダム化比較試験218件のアブストラクトのテキストファイルの大きさは、文献数:218ですが、ファイルサイズ:508KB、ワード数:68,445 、文字数:519,222でした。このサイズは、無料版Geminiでは取り扱える範囲を超えています。Google Workspace Business Standardエディションなどの有料版では、容量が3.2万トークンから100万トークに容量が増えます。NotebookLMで使えるファイル数などもずっと大きくなり、Googleドライブも2TBまで使え、Google Meetなどの機能拡張もあるので、自分はこのGoogle Workspace Business Standardエディションを使っていますので、100万トークン、約70万語の容量まで利用可能です。

以下に述べるトライアルは2025年12月6日の時点での結果です。思考モード(3 Pro搭載)を使うこともできますが、高速モードを用いていますので先に述べたように、Gemini 2.5 Flashを使っています。まず、Geminiへのプロンプトを入力するフィールドにアブストラクトのテキストファイルをドラグアンドドロップします。ワード数が約6.8万なので、問題なくアップロードできます。(ファイルが大きすぎる場合はアラートが出ます。)それに続けて、以下のプロンプトを書き込み、今までどのような抗生物質がテストされてきたかをまず調べます。

ソースのテキストファイルからランダム化比較試験で効果が分析された薬剤の一覧を作成してください。薬剤名は原文のままで構いません。

プロンプトを書き込んで、エンターキーを押すか右向き矢じりをクリックした結果の最初の部分を以下の図に示します。

この場合は、”Googleスプレッドシートにエクスポート”のボタンが表示されたので、それをクリックして、Googleスプレッドシートにエクスポートし、ファイル名を書き換えたのが以下の図です。このように、最初にどのような治療法が分析対象になっているかを確認することができます。スプレッドシートに出力したい場合、追加のプロンプトで”表をスプレッドシートにエクスポートできるように作成してください。”と書くことで、CSVファイルとして保存できるデータが出力されるので、これをテキストエディタにコピーして貼り付けて.csvの拡張子で保存し、そのファイルをGoogleスプレッドシートやExcelでインポートする方法が使えます。

また、Geminiは注記として、以下の説明を出力しました。

Abstractの情報に基づいているので、必ずしもすべての抗菌薬の名称が明らかになるわけではありませんということです。

試しに、Levofloxacinの効果について聞いてみることにしました。PICO要約表を作成するように指示しており、採用基準と除外基準を設定して、ランダム化比較試験に限定するよう指示しています。このプロンプトは採用基準と除外基準を書き換えることで、プロトタイプとして、他のクエスチョンにも使えるはずです。

ソースのテキストファイルから、以下の採用基準と除外基準に合致する文献を抽出して、Study ID、P、I、C、O、コメント、PMIDの7列からなる表を作成してください。
Study IDは第一著者の姓のフルスペル+半角スペース+イニシャル+半角スペース+年度を記述してください。
Pの欄は対象者に関する記述(症例数)、Iの欄は介入に関する記述(症例数)、Cの欄は対照の治療に関する記述(症例数)、Oの欄は測定されたアウトカムの内容を記述してください。
コメント蘭は効果の概略を記述してください。
PMIDの欄はhttps://pubmed.ncbi.nlm.nih.gov/PMID/のように、クリックしたらPubMedの該当する文献を開けるようなリンクのURLを記述してください。
P, I, C, Oの欄は他の研究との違いが分かる程度の詳細な情報を含めてください。研究は年度の新しい順に並べ、Googleスプレッドシートへエクスポートできる形式で提示してください。
採用基準:
研究デザインはランダム化比較試験。
対象は成人の大腸憩室炎の患者。
介入がLevofloxacin。
対照がプラセボあるいは無治療あるいは保存的治療。
治癒をアウトカムとして分析。
除外基準:
システマティックレビュー/メタアナリシスの論文は除外する。
対象が小児患者は除外する。

当然のことながら、Levofloxacinを治療薬として使用しているランダム化比較試験は見つからないと回答し、使用された抗生物質をリストアップして、「介入がLevofloxacin」という基準を除外し、「抗生物質群と無抗生物質(または非観察的/非手術的)群を比較した成人非合併大腸憩室炎を対象とするランダム化比較試験(RCT)」を抽出した参考情報としての表を出力した、と回答しています。表の部分ををCSVファイルとして保存し、さらにGoogleスプレッドシートにインポートして形式を整えた画面が以下の図です。

IとCの部分を見ると、介入Iの方が抗生物質なしになっており、対照Cの方が抗生物質治療になっていて、非劣性試験も含まれています。結果は、少なくとも軽症の急性憩室炎では、抗生物質は観察的治療と比べ差がないことが示されています。これだけからも、大腸憩室炎に対して抗生物質による治療が必要ないということが最近の潮流ではないかということがうかがい知れます。

PMIDの部分のURLをクリックするとPubMedでその文献のアブストラクトが表示されるので、それぞれのアブストラクト情報を確認することができます。

さらに、診療ガイドラインの情報が含まれているか聞いてみました。

ソースに診療ガイドラインは含まれていますか?

AGAのアップデート、ドイツ消化器病・代謝疾患学会およびドイツ一般・内臓外科学会の憩室疾患に関するガイドライン、デンマークの治療ガイドライン、オランダ社会のガイドラインが引用され、SAGES ホワイトペーパーについて次のように記述されていました:SAGES ホワイトペーパー これは、抗生物質の非ルーチン使用に関するエビデンスをレビューし、安全な実施方法を検討したものです 。

さらに、また、治療アルゴリズムや伝統的なパラダイムの変化を議論し、臨床的推奨に影響を与える以下の文献も含まれています、との記述が続き、文献が引用されていました。そして、これらの文書は、大腸憩室炎の診断、内科的・外科的治療、および再発予防に関する従来の慣行が変化していることを示しており 、特に非合併急性憩室炎に対する抗生物質の非ルーチン使用が最新の推奨事項であることを裏付けています、との記述がありました。

これらの回答から、大腸憩室炎に対して抗生物質をルーチンで投与することは必要ないことが分かってきます。そこで、対象者について以下のプロンプトでさらに確認してみましょう。

抗生物質非ルーチン使用の対象となる大腸憩室炎患者の条件は?

抗生物質の非ルーチン使用(すなわち、抗生物質を投与しない観察的治療)の対象となる大腸憩室炎患者の条件は、主に非合併急性憩室炎(AUD)の患者です 、との回答に続き、憩室炎のタイプ、免疫状態・全身状態、画像診断による評価について詳細が示され、さらに、非推奨/注意が必要な患者(抗生物質が推奨される場合)について回答が続きます。そして、最後に治療パラダイムの変化の解説がありました。

218件の文献のアブストラクトを全部読む時間と労力に比べると、あっという間にこのような情報が得られます。

今回Geminiの回答が正確かどうかについて確認するひとつの方法として、診療ガイドラインを参照することが考えられます。AGAの診療ガイドラインの論文についてPMIDをGeminiに聞いて、その論文を見てみることにします。この論文です: Peery AF, Shaukat A, Strate LL: AGA Clinical Practice Update on Medical Management of Colonic Diverticulitis: Expert Review. Gastroenterology 2021;160:906-911.e1. doi: 10.1053/j.gastro.2020.09.059 PMID: 33279517

この論文のアブストラクトには”Antibiotic treatment can be used selectively rather than routinely in immunocompetent patients with mild acute uncomplicated diverticulitis. Antibiotic treatment is strongly advised in immunocompromised patients.”と明確に書かれており、Geminiの回答は正確であると言っていいと思われます。また、この論文のPubMedのアブストラクトのページには、Full text linksもあるので、必要ならさらに全文を目を通してGeminiの回答が正しいかを確認することもできます。

最後に、「抗生物質非ルーチン使用の対象となる大腸憩室炎患者の条件は?」に対するGeminiの回答の詳細を提示しておきます。

かなり詳細な情報なので、実際の症例に抗生物質を投与すべきかどうかの判断に使えると考えられます。

今回の例から、PubMedの検索結果からランダム化比較試験のアブストラクト情報を得て、Geminiを利用することで、極めて短時間で臨床に必要な情報が得られることが分かりました。また、PICO要約表を作成することもできるので、システマティックレビュー/メタアナリシスの文献選定にも使える可能性があることが分かりました。