システマティックレビューでは採用された研究を個別に評価する必要があります。その後、複数の研究をまとめてエビデンス総体の評価をアウトカムごとに行います。
メインスライドと解説のPDFファイルはこちらURL:https://info.zanet.biz/lec/srsz/3-meta-main/3-meta-note.pdf
学習者用アクションマップのPDFファイルはこちらURL:https://info.zanet.biz/lec/srsz/3-meta-main/3-meta-stu-am.pdf
このウェブページのURL:https://info.zanet.biz/lec/srsz/3-meta-main/one.htm
システマティックレビューの一部が定量的統合、すなわち、メタアナリシスです。
メタアナリシスの目的は、そのアウトカムに対する介入の効果の大きさと、その統計学的な確実性を知ることにあります。メタアナリシスは複数の研究をまとめ、効果推定値 とその95%信頼区間を明らかにする、と言い換えることができます。
効果の大きさを表すために、さまざまな指標が用いられています。アウトカムが治癒・非治癒のような二値値変数の場合にはリスク比、オッズ比、リスク差などが効果指標として用いられ、イベントが起きるまでの時間を比較する場合にはハザード比、アウトカムが連続変数で測定される場合には 平均値差や 標準化平均値差が 効果指標として用いられます。
メタアナリシスでは複数の研究をまとめた、これら効果指標の統合値と95%信頼区間が得られます。
まず、メタアナリシスの原理を簡単に説明します。
たとえば、ある都市の住民の平均体重を知りたいときに、個々の住民の体重はわかりませんが、ある地区の住民5名の平均体重が68Kgであることがわかっているとします。そして、別の地区の住民10名の平均体重が70Kgであることがわかっているとします。このデータから市の住民の平均体重を知りたい場合、 (68×5 + 70 ×10)/(5 + 10)で算出できます。メタアナリシスでは、各研究の効果指標の値がそれぞれの地区の住民の平均体重に相当し、効果指標の分散の逆数がその人数に相当します。
サンプルの人数が多いほど平均値のばらつきが小さくなり、分散も小さくなり、分散の逆数と人数が比例するということは直感的に理解できると思います。
効果指標の統合値はそれぞれの分散の逆数で重み付けした平均値に相当します。信頼区間は分散の逆数の総和の逆数の平方根を標準偏差として、その1.96倍離れた値になります。
分散Variance
xiに係数aを掛け算した値の分散Variance
分散逆数法のメタアナリシス統合値の分散
メタアナリシスにはさまざまな統計学的手法があります。統計学的なアプローチの違いとして、頻度論派の伝統的な統計学に基づく方法と、ベイズ統計学に基づく方法があります。
いわゆるアグリゲートデータ、すなわち研究ごとの効果指標の値を統合する、古典的なメタアナリシスと、個々の症例のデータの提供を受けてそれらを統合するIPDメタアナリシスがあります。
また、新しい研究が発表された際にそれをそれまでのメタアナリシスに追加して、順次研究数を増やしていく、累積メタアナリシス、さらに統合値が無効化の方向へ変動しているかどうかを解析するTrial Sequential Analysisが行われる場合もあります。
さらに、近年論文数が増加している、3つ以上の介入を同時に比較するネットワークメタアナリシスがあります。ネットワークメタアナリシスは間接比較のデータも用いるので、理論的にはペア比較の通常のメタアナリシスより確実性が高まるとされています。また、シングルアームの臨床研究のデータも利用できるアームベースネットワークメタアナリシスも用いられることがあります。
診断精度研究のメタアナリシスの場合、感度・特異度の統合値が得られます。感度と特異度の間には通常負の相関があるため、二変量モデルが推奨されており、さらに割合の変数の分布をバイアスなく取り扱うため二項分布を用いる方法が推奨されています。感度と特異度の関係を示すことができるHSROCモデルはSROC曲線のパラメータから任意の特異度に対する感度の値を知ることができます。すなわち、閾値を変動させた際の感度・特異度を知ることができます。
出版バイアスを減らすために、出版された論文だけでなく、学会プロシーディングスなどいわゆるグレイリタラチャーも用いる場合もあります。
メタアナリシスではランダム効果モデルと固定効果モデルの少なくとも2種類のモデルが用いられています。
まず固定効果モデルを見ていきましょう。固定効果モデルはFixed effects modelとeffectが複数形のeffectsとなっています。それでは、Fixed effect modelと単数形のモデルもあるのでしょうか?
実はありますが、それはFixed effects modelとは異なります。
なぜ、複数形なのでしょうか。メタアナリシスでは複数の研究を統合します。それぞれの研究の効果推定値はeffectと単数形で表すことができます。複数の研究をまとめるとなると、effectsと複数形になります。メタアナリシスに含める研究の平均値を知ることが、固定効果モデルの目的です。メタアナリシスの解析対象は選択された研究だけに固定されていて、それ以外の研究は考えません。平均値を知ることに意義があるのであれば、固定効果モデルを用いることに何の問題もありません。
一方、ランダム効果モデルRandom effects modelはそれそれの研究で得られる効果推定値、すなわち効果指標の値は、ある一定の分布に従っているより大きなサンプル空間からのランダムサンプルで、その中の一つの値であると考えます。より大きなサンプル空間を想定するので、今後の研究の結果を推定することにも使えます。臨床研究のメタアナリシスの場合は、ランダム効果モデルを用いるべきとされています。臨床研究は、研究デザイン、対象者、研究の執行、研究のセッティングなどを同一にすることは困難です。研究結果は、偶然によるサンプリングエラー以外の要素の影響を受けます。そのため、もともと各研究の効果推定値はある一定の分布に従っているより大きなサンプル空間からのランダムサンプルで、その中の一つの値であるという考え方がマッチします。
ランダム効果モデルでは、各研究の効果推定値が計算された後、各研究間の分散が計算され、それが各研究の効果推定値の分散に合算され、その逆数を重みに用いて統合値が算出されます。ランダム効果モデルは統合値が真の値として意味を持つという解釈だけでなく、その分布も実際にありうる値とみなす必要があります。真の値がその値である確率ではなく、その値で効果が認められる確率と考えるべきです。二つの考え方は結果としては同じになるかもしれませんが、
Hedges LV, Vevea JL (1998). “Fixed- and Random-Effects Models in Meta-Analysis.” Psychological Methods, 3(4), 486?504.
Laird NL, Mosteller F (1990). “Some Statistical Methods for Combining Experimental Results.” International Journal of Technology Assessment in Health Care, 6(1), 5?30.
Higgins JP, Thompson SG, Spiegelhalter DJ: A re-evaluation of random-effects meta-analysis. J R Stat Soc Ser A Stat Soc 2009;172:137-159. doi: 10.1111/j.1467-985X.2008.00552.x PMID: 19381330 https://pubmed.ncbi.nlm.nih.gov/19381330/
Ades AE, Lu G, Higgins JP: The interpretation of random-effects meta-analysis in decision models. Med Decis Making 2005;25:646-54. doi: 10.1177/0272989X05282643 PMID: 16282215 https://pubmed.ncbi.nlm.nih.gov/16282215/
研究間の変動(variation)の原因:
1.アウトカム定義のランダムな変動
2.対象者の変動
3.プロトコールの変動
4.プロトコール実行の変動
メタアナリシスの結果として、効果指標の統合値と95%信頼区間が得られますが、ここに示すForest plotとして出力されることが一般的です。
この例では、効果の大きさを表すのに、リスク比が用いられています。中央部分の下の方に菱形で示されているのが、統合値と95%信頼区間です。各研究の効果指標の値と95%信頼区間はその上に表示されています。中央の正方形は分散の逆数、すなわちサンプルサイズに応じた大きさで表示されます。バーの長さは95%信頼区間を表しています。右側には実際の値が表示されています。
左側の方には、各研究からのデータが表示されています。アウトカムが治癒という二値変数なので、対照群と介入群の症例数とアウトカムが生起した例数、すなわちイベント数が示されています。
右側には、さらに各研究の相対的な重みの値がパーセントで示されています。これは各研究の効果推定値の分散の逆数から計算されています。
左下には、統計学的な異質性の指標として用いられる、I二乗値、タウ二乗値、Q統計値とそのP値が示されています。右下には、統合値に対するZ値とP値が示されています。
これはFunnel plotです。漏斗を伏せた形からその様に呼ばれています。Funnel plotは出版バイアスの可能性について判断するのに用いられます。丸は個々の研究の効果推定値を表し、横軸がそのスケールになります。左側に示す例では、リスク比を用いており、対数変換した値です。
Funnel plotでは、横軸が効果指標の値、縦軸がサンプルサイズあるいは標準誤差の逆数などの正確度の指標で、下の方ほどサンプルサイズが小さい研究になるため、左右にばらつき、上の方ほど、真の値近づくという分布になります。
右上の例では、下の方の点が左右均等に分布しているので、オッズ比の値が大きい研究も、小さい研究も同じように報告されていると考えられ、出版バイアスはないと判定されます。
もし、例えば、右下の例のように、下の方の点が右側に分布していない場合、大きなオッズ比の値が得られた研究が報告されていなかったことを疑わせることになり、出版バイアス(報告バイアス)が疑われます。
また、この分布に直線回帰を当てはめ、P値を計算するEggerの検定あるいはBeggの検定も出版バイアス判定の際に参照されます。なお、Beggの検定はノンパラメトリック検定の方法です。
ただし、研究数が10件以上(5件以上という専門家もいる)のときに限り、ファンネルプロットや検定を用いるべきとされている。
伝統的統計学、すなわち頻度論派統計学、の考え方に基づくメタアナリシスの手法とベイズ統計学、すなわちベイジアンの考え方に基づくメタアナリシスの手法のどちらも広く用いられており、ベイジアンの方法によるものはネットワークメタアナリシスなど複雑なモデルの場合に使われる傾向があります。
メタアナリシスのためのソフトウェアは多数発表されていますが、フリーの統計解析プラットフォームであるR用のパッケージであるmetafor、コクランのRevManなどがあります。これらを活用することで、比較的容易にメタアナリシスを実行することができます。これらは、頻度論派の手法によるものです。
診断精度研究のメタアナリシスの場合は、MetaDisc2.0やJAGSやOpenBUGSを用いたプログラムが用いられています。MetaDisc2.0はRとShinyを用いたウェブアプリケーションで、ブラウザーでサイトを開いて、Excelで用意したデータをアップロードして解析ができます。
ネットワークメタアナリシスには、gemtcを用いることができますが、RとRのパッケージであるrjagsとベイジアン解析のためのJAGS (Just Another Gibbs Sampler)をインストールする必要があります。また、アームベースネットワークメタアナリシスにはpcnetmetaを用いることができます。
----------
Viechtbauer W: Conducting Meta-Analyses in R with the metafor Package. J Stat Software 2010;36:1-48. https://metafor-project.org/doku.php/metafor
https://cran.r-project.org/web/packages/metafor/index.html
Cochrane Collaboration RevMan https://training.cochrane.org/online-learning/core-software/revman
Plana MN MetaDiSc2.0? https://ciberisciii.shinyapps.io/MetaDiSc2/
Doebler P: mada https://cran.r-project.org/web/packages/mada/index.html R
MRC Biostatistics Unit: OpenBUGS: https://www.mrc-bsu.cam.ac.uk/software/bugs/openbugs/
Plummer M JAGS https://mcmc-jags.sourceforge.io/
van Valkenhoef G: gemtc https://cran.r-project.org/web/packages/gemtc/index.html R, rjags, JAGS
Lin L: pcnetmeta https://cran.r-project.org/web/packages/pcnetmeta/index.html R
Balduzzi S netmeta https://cran.r-project.org/web/packages/netmeta/index.html
The Comprehensive R Archive Network (CRAN): https://cran.r-project.org/ R
RevManはコクランのシステマティックレビュー用に提供されているソフトウェアで、RevMan Webというブラウザー上で動作するものと、ダウンロードして用いるRevMan 5があります。使用するためには、いずれも、Cochraneに登録する必要があります。現在ウェブ版のみになっており、有料化されています。
RevMan: https://training.cochrane.org/online-learning/core-software/revman
Meta-analysis IZ rでは、Mindsの評価シートからセルA3から効果指標(種類)のデータを含む範囲をコピーし、上のフィールドに貼り付けて、Reformatボタンをクリックして形式を変えてから、メタアナリシスの実行ができます。
Meta-analysis IZ rのURL: https://stat.zanet.biz/sr/meta-analysis-r.htm
システマティックレビュー/メタアナリシスを論文化する場合は、研究プロトコールができた時点で、PROSPERO International rospective register of systematic reviesに登録しましょう。
システマティックレビュー/メタアナリシスの構想の段階でも、PROSPEROで類似の研究があるかどうか調べることが必要です。出版される前の時点の研究も検索することができるので、もしすでに類似の研究が進行中の場合は、別のテーマを取り扱うべきだということを知ることができます。
PROSPERO https://www.crd.york.ac.uk/PROSPERO/
システマティックレビュー/メタアナリシスの論文執筆ガイダンスとしてPreferred Reporting Items for Systematic Reviews and Meta-Analyses (PRISMA)があり、PRISMAの推奨に沿って論文を執筆することが必要です。
2020年の改定で、論文検索フローチャートの形式が変更されています。日本語訳も発表されています。下記URLから閲覧できます。
PRISMA http://www.prisma-statement.org/
PRISMA日本語訳PDF http://www.prisma-statement.org/documents/PRISMA_2020_Japanese.pdf
論文中に記載されている効果指標の値、リスク人数すなわち対象者数のデータを抽出します。
リスク比、オッズ比、リスク差などの場合は、人数のデータを抽出します。対照群の症例数とイベント数、すなわちアウトカムが生起した症例数、および、介入群の症例数とイベント数です。
ハザード比の場合にはハザード比の対数の値と、対数スケールでの標準誤差の値を抽出します。
連続変数の場合には、平均値と標準偏差の値を抽出します。
リスク比、オッズ比、リスク差の自然対数とその標準誤差(95%信頼区間から計算することも可能)がわかれば、それらから統合値を計算することもできます。
Forest plotを作成するためには、効果に関連する数値データ以外の情報も必要になります。
研究IDは多くの場合第一著者と年度が用いられます。そして、解析対象の数値データ、Forest plotのレベル用のデータが必要です。すなわち、対照・介入の名称、アウトカムの記述、効果指標のタイプ、例えば、Risk Ratio、などとその短縮形、Risk RatioであればRR。
そして、多くの場合、Forest plot内にメタアナリシスのモデルについての情報が書かれています。今回は、分散逆数法でDerSimonian-Laird法によるランダム効果モデルを用います。
MA-IZの解析データはデータサンプルをコピーしてExcelに貼り付けることで確認できます。Excelで自分のデータに書き換えて、それに対してメタアナリシスを実行し、解析結果の数値データとForest plotとFunnel plotを出力します。
リスク比、オッズ比、ハザード比は自然対数に変換して計算が行われるます。リスク差、平均値差は元のスケールのまま統合の計算が行われます。
学習終了後にこの学習ユニットの評価をお願いします。1分ほどで終了します。学習ユニット評価