Agency for Healthcare Research and Quality (AHRQ)は2018年に定量的統合すなわちメタアナリシスに関するレポートのアップデートを発表しています。執筆者は12名、ピアレビューは15名が担当しています。
5章から構成され、以下のテーマが取り上げられています。1. 試験結合の決定、2. エフェクトサイズデータの使用の最適化、3. 研究結合のための統計学的モデルの選択、4. 統計学的異質性の定量化・検定・探索、5. ネットワークメタアナリシス。
ここでは、第1章 試験結合の決定の概要を紹介します。メタアナリシスをしようと思った時に出てくるさまざまな疑問に答えられる有用な情報です。メタアナリシスをすべきか決めるためのフローチャートが提示されており、それに沿って考えることは役に立つと思います。
*左上のパネルの左側のボタンは目次を表示します。右側のボタンは最後のスライドにある2つのQuizを表示します。
Morton SC, Murad MH, O’Connor E, Lee CS, Booth M, Vandermeer BW, Snowden JM, D’Anci KE, Fu R, Gartlehner G, Wang Z, Steele DW. Quantitative Synthesis? An Update. Methods Guide for Comparative Effectiveness Reviews. (Prepared by the Scientific Resource Center under Contract No. 290-2012-0004-C). AHRQ Publication No. 18-EHC007- EF. Rockville, MD: Agency for Healthcare Research and Quality; February 2018. Erratum October 2022. Posted final reports are located on the Effective Health Care Program search page. DOI: https://doi.org/10.23970/AHRQEPCMETHGUIDE3
以下の順で類似性をチェックする。
1.PICOの内、PICすなわち研究対象、介入、対照
2.研究デザイン、測定法、など方法論、セッティング
3.アウトカム(O)
4.経過観察期間
十分類似しているという判断は本来的に主観的なものである。
研究間のばらつきが大きく、類似しているとは言えない場合、類似性の高い一部を用いることを考慮する。
通常のランダム化比較試験とクラスターランダム化比較試験は統合することが可能であるが、クラスターランダム化比較試験にたいしては適切な調整が必要である。
測定されたアウトカムに違いがある場合、何らかの調和策を用いることを考慮する。
メタアナリシスを行わない判断をした場合、各研究を表で提示したり、統合値を含まないForest plotを提示する。
“ベストエビデンス”試験は通常低バイアスリスクの大規模試験で、外的妥当性の高い臨床試験である。
特に、まれなイベントをアウトカムに設定している場合、小規模な試験は検出力が低く、大規模試験に追加してプールすることは避けるべきである。
統合値の信頼区間が幅広く、ある場合は無効果の閾値を挟むこともある。そのような場合、特に小規模な研究が多い場合には、ランダムエラーによる場合もあるが、それを説明する特徴を探索する必要がある。
実際に、介入が異なる亜群で異なる効果を示し、ある亜群では望ましい効果を示すが、別の亜群では望ましくない効果を示したりすることもある。そのような場合、ひとつの平均効果を提示するだけではミスリードする可能性がある。
効果が示されなかったため出版されなかった(出版バイアスのリスクがある)、あるいは、効果の示されたアウトカムについての結果だけが出版された(報告バイアスのリスクがある)可能性を探る必要がある。そのアウトカムが報告されている研究と報告されていない研究を比較して、アウトカムの報告の欠損がランダムに起きているかを検討することができる。そのアウトカムのリスクが一定の集団が選択されている場合、それらの研究だけを統合することも考慮する必要がある。
小規模研究が大規模研究より大きな効果を示しているような場合、出版バイアスあるいは報告バイアスのためかもしれない。研究数が10以上の場合、Eggerの検定で出版バイアスの可能性を調べることもできる。もし、小規模研究効果の可能性が高い場合、プールした結果はミスリードする可能性があるので、メタアナリシスをしない選択もあり得る。
研究の数が少ない場合、例えば10未満のような場合、特に、アウトカムがまれなイベントであったり、各研究のバイアスリスクが高い場合に、メタアナリシスの結果は過大評価になりやすい。
検討するアウトカムが主要アウトカムでない場合、研究の統計学的検出力は不十分であり、小規模研究効果の影響を受けやすくなる。
小規模研究を定義づけるサンプルサイズは分野により、アウトカムにより異なる。もしイベント率が10%だとすると、各アームの症例数が100から200の場合でも小規模と言える。一方、連続変数であるQOLスコアがアウトカムの場合、各アーム20から30人であれば小規模と言えるであろう。
このような場合、Optimal Information Size (OIS)最適情報量をチェックすることを考慮する。OISは一つの研究とみなした場合、メタアナリシスの結果を得るために必要なサンプルサイズの事である。
研究の数が少ないと、特に5~7より少ない場合は、統計学的異質性の指標は過小評価になるリスクが高くなる。
I2値はサンプルサイズが小さい研究が多いと見かけ以上に小さな値になり、サンプルサイズが大きい研究が多いと見かけ以上に大きな値になる。I2を用いる研究間の異質性の評価は値だけでなく、研究数、研究のサンプルサイズ(規模)、効果の大きさ、方向性を考慮して、判断すべきである。
臨床的、方法論的異質性その他の因子からプールが可能と判断したら次に統計学的な異質性を考慮する。そのためには、試験的にメタアナリシスを実施する必要がある。
臨床的、方法論的に異質性が低いと判断され、“ベストエビデンス”試験はなく、ミスリードする結果にはなりそうもなく、研究数が少ない場合特別な慎重さが必要になる。
この段階で、高リスクと判断されれば、プールするのはやめることを考慮する。
1. メタアナリシスの結果は意味ある疑問に対する科学的に妥当な答えを見つけるのに手助けになるか?
2. メタアナリシスは個々の研究を見ることから理解されることに加え何かを提供するか?
3. 一体となった複数の研究の統計学的特徴は妥当な方法で定量的に結合しまとめることを許すか?
4. それぞれの判断で考慮すべきことがあり、ガイダンスがあっても判定は主観的なものである。
以下の順にチェック:
臨床的・方法論的類似性
質の高い大規模研究または質の高い少数の小規模研究の有無
プールした場合ミスリードする結果を得るリスク
少ない研究数
小規模研究、広い信頼区間、まれなイベント
統計学的異質性
Quiz 1
Quiz 2