相対効果指標から絶対効果を求める How to convert RR OR HR to RD

介入の効果は対照群と比較した相対的効果指標であるリスク比Risk Ratio (RR)、オッズ比Odds Ratio (OR)、生存分析の場合はハザード比Hazard Ratio (HR)で評価されることが一般的です。Risk Difference (RD)をメタアナリシスで統合することももちろんできますが、これらの効果指標が用いられることが多く、エビデンス総体の非一貫性の評価の際はRRまたはHRを用いることが望ましいとされています。ネットワークメタアナリシスではORが用いられることが多いようです。まずこれらの効果指標がどのように計算されるかを見ておきましょう。

図1.効果指標のタイプと計算法。
図2.イベント確率(割合)、ハザード率およびハザード比の関係。介入群のハザード率を対照群のハザード率で割り算するとハザード比が得られる。対照群のハザード率にハザード比を掛け算すると介入群のハザード率が得られる。

一方、望ましい効果(益)の大きさ、望ましくない効果(害)の大きさを異なるアウトカム間で比較するには、絶対効果を示すリスク差Risk Difference (RD)を用いる必要があります。RR, OR, HRでは同じ値であってもベースラインリスクが異なるとRDが異なるので、絶対効果の大きさは同じとはならず、そのまま比較することはできないことは明らかです。一方、RDは値が2倍になれば、2倍の人数の人が影響を受けることは明確です。

メタアナリシスでOR、RRあるいはHRを統合した場合、それらについて、エビデンスの確実性の評価をランダム化比較試験であれば、バイアスリスク、非直接性、不精確性、非一貫性、出版バイアスの5ドメインから評価します。その先、望ましい効果(益)、望ましくない効果(害)の大きさと、益と害のバランス=正味の益を評価するためには、絶対効果=RDを求める必要があります。そのため、GRADEアプローチではSummary-of-Findings (SoF)table結果のまとめ表では①相対効果指標と95%信頼区間、②対照群の絶対リスク、③介入群の絶対リスク、and/or、④絶対効果と95%信頼区間を記述することが求められています。相対効果指標と95%信頼区間はメタアナリシスから得られます。対照群の絶対リスクはメタアナリシスに含めた研究の対照群の総症例数から算出した値、疾患レジストリなど他のデータソースからの値、想定される高・中・低リスクの値を設定するなどが考えられます。

絶対効果はRR、OR、HRと対照群の絶対リスク=CER (Comparator Event Rate)から以下に示す方法で計算することができます。

図3.相対効果指標から絶対効果を求める。CER×(1-RR)で得られる絶対効果の値は、対照群の絶対リスク-介入群の絶対リスクに相当します。CER×(RR – 1)で得られる絶対効果の値は介入群の絶対リスク-対照群の絶対リスクの値になります。これら2つの値は正負が逆になりますが、絶対値は同じです。

ORからRRを計算する方法は図4に、HRからRRを計算する方法は図5に示す通りです。数式の形を変えるだけなので、単なる数学的な課題で、だれが考えても同じになります。

図4.ORからRDを計算する。ここに示すRDの計算は図3とは逆に、介入群の絶対リスク-対照群の絶対リスクを計算しています。
図5.HRからRDを計算する。ここに示すRDの計算は図3とは逆に、介入群の絶対リスク-対照群の絶対リスクを計算しています。

RDを計算する際に、介入群の絶対リスク-対照群の絶対リスクを計算する方が分かりやすいと思います。図4と図5、6は逆になっていますが、測定されるアウトカムが有害事象なのか有益事象なのかによってもどちらが分かりやすいかはまた変わってきます。

いろいろな考え方がありえますが、正味の益=益の大きさ-害の大きさで計算し、プラスの値であれば、正味の益が大きく、マイナスの値であれば正味の害が大きいというようにするためには、益のアウトカムには有益事象を測定し、害のアウトカムには有害事象を測定し、介入群の絶対リスク-対照群の絶対リスクを計算すると介入群の益が大きければ益はプラスの値、介入群の害が小さいと害はマイナスの値になり、正味の益=益の大きさ-害の大きさの計算ではプラスの値からマイナスの値を引き算するので、全体としてプラスが大きくなります。もし、介入群の害が対照群より大きい場合は、害はプラスの値になり、正味の益はその分引き算されて小さくなります。このような取り扱いが分かりやすいのではないかと思います。

アウトカムが有害事象か有益事象かに合わせてプラスマイナスを変えて計算し、RD=CER×(1-RR)ですべて計算する方法もあり得ます。その方が分かりやすい人もいると思います。また、グラフ化する際にはもう少し考慮すべき点がありますが、皆さんも考えてみて下さい。

そして、100人あたり、1000人あたり、10000人あたりの頻度人数にするには、RDにこれらの値を掛け算することになり、四捨五入するか切り捨てるかも決めておく必要があるでしょう。

正規分布に従う複数の変数に重みの値を掛け算した値の総和の分散

Linear combination of n variables with normal distributions with weights. 重みを係数coefficientsと言い換えてもいいです。

すぐにはピンとこないかもしれませんが、例えば、日本人の夫婦の身長の合計、つまり二人の身長の合計の平均値と分布を知りたいとします。それぞれ夫と妻の身長の分布が正規分布に従っているとします。日本人の夫の身長の平均値と分散、分散は標準偏差の二乗です(個々の値と平均値の差の二乗値の平均値が[標本]分散です)、が分かっていて、妻の身長の平均値と分散が分かっているとします。夫と妻のペアはランダムな組み合わせだとすると、(実際には背の高い妻は背の高い夫がいるというようなある程度の相関があるかもしれませんが、まずは妻と夫の身長の間にはそのような相関が無い、つまり共分散が0と仮定しておきます)、夫の身長と妻の身長の合計値の分布はどうなるでしょうか?平均値はそれぞれの平均値の和になり、分散はそれぞれの分散の和になります。

日本人の妻の集団からランダムに一人抜き出し、日本人の夫の集団からランダムに一人抜き出し、かれらの身長を測って、合計するということを繰り返した場合、その合計値の分布はどうなるかという風に考えてみて下さい。

このような計算がどいう時に使われているかというと、突然話が飛びますが、例えば分散逆数法Inverse-variance methodによるメタアナリシスの際に統合値の分散を求める際に使われています。計算法を図1に示します。今度は、妻と夫の身長という二つの変数ではなく、研究の数分の変数を扱います。

図1.分散逆数法のメタアナリシスにおける統合値の分散の計算。

一つの研究の効果推定値(リスク比、オッズ比、ハザード比の自然対数、連続変数であれば平均値)に対して、その分散の値の逆数を重みとして掛け算して、その総和を重みの総和で割り算すると統合値が得られます。

その統合値の分散を計算するにはどうするか?分散の逆数の総和の逆数をΣの内側に移動させることができるので、各研究の効果推定値に掛け算される値は、その総和で各研究の重みの値、つまり、各研究の効果推定値の分散の逆数を割り算した値になります。これが、係数として各研究の効果推定値に掛け算されているとみなせます。そして、統合値の値の分散はこの係数の二乗値を各研究の効果推定値の分散に掛け算した値の総和になります。

ただし、各研究の効果推定値は独立していて、相関が無いことが前提です。また、それぞれの効果推定値は正規分布に従うことが前提です。つまり、リスク比、オッズ比、ハザード比の自然対数、連続変数であればその値が、正規分布に従うことを前提としています。

さて、正規分布に従う複数の変数に重みの値を掛け算した値の総和の分散のより一般化した計算法を図2に示します。

図2.正規分布に従う複数の変数に重みの値(係数a)を掛け算した値の総和の分散の計算法。

各変数のペアで相関がない場合で、この図で示すCov、つまり、共分散の値が0の場合が、上で述べた計算です。図2の2つ目と3つ目の式でCov(Xi,Xj)=0となるので、各研究の効果推定値に係数の二乗を掛け算した値の総和が統合値の分散になります。また、係数aiが1で共分散が0の場合は、それぞれの変数の分散を合計すればXiの合計の分散になります。最初に述べた、妻と夫の身長の和の分布の分散の計算の場合はこれに相当します。

メタアナリシスの分散逆数法の統合値の分散は各研究の分散の逆数の総和の逆数になりますが、実は、ここで二つの図で示した計算式から証明することができます。図3、図4にそれを示します。

図3.分散逆数法メタアナリシスの統合値の分散の計算。係数に相当する部分の計算。
図4.分散逆数法メタアナリシスの統合値の分散の計算。各研究の効果推定値の分散の逆数の総和の逆数が統合値の分散になることを示す。

また、これらの計算には、分散共分散行列を計算に用いることもでき、変数間に相関がある場合にも対応できます。その際には、行列計算の知識が必要になります。

今回解説した、係数を掛け算した正規分布に従う変数の平均値の分散の計算は価値観で重みづけした効果推定値の総和、すなわち正味の益(net benefit, benefit-harm balance)の分散の計算でも、バイアス効果で調整した統合値の分散の計算でも用いられます。

一般化した言い方をすると、”正規分布に従う複数の変数に重みの値を掛け算した値の総和の分散”ということになります。重みづけ平均値とあわせて理解しておく必要があると思います。

そして得られた分散の値の平方根に1.96を掛け算してブラスマイナスすると95%信頼区間が得られます。さらに、例えば正味の益が0以上の確率やある閾値以上の確率を計算することもできます。

Six persistent research misconceptions

Modern Epidemiology*の著者の一人である、Rothman KJは2014年に”研究における持続する6つの誤解”というタイトルの論文を発表しています(Rothman KJ: Six persistent research misconceptions. J Gen Intern Med 2014;29:1060-4. doi: 10.1007/s11606-013-2755-z PMID: 24452418

以下にそれを紹介します。ここに書いたことは短いまとめなので、これだけを読むと、さらに誤解をする人がいるかもしれません。原文をじっくり読んでいただきたいと思います。

誤解1. 研究デザインには階層があり、ランダム化比較試験が最も妥当性が高く、次にコホート研究が続き、症例対照研究は最も信頼性が低い。  

深く考えずに、高い妥当性を研究デザインの階層に帰するのは間違いである。

「研究デザインのみに基づいて結果の妥当性を判定することは、すべきではないという意味であって、研究デザインを明確にすることが不要であるという意味ではない。ランダム化比較試験であっても、バイアスの大きな研究の妥当性は低くなることに異論はないであろう。」

 誤解2. 研究から妥当性の高い一般化を行うために必須の要素は、研究対象者が標的集団の代表的サンプルで構成されていることである。

  科学的な一般化generalizationと統計学的外挿extrapolationは異なる。科学的一般化は自然現象について正しい声明を作るプロセスである。

「例えば、動物実験では、単一種を用いて、要因曝露や治療の効果をとらえやすくできる。ヒトを対象にした研究でも、効果を証明するために、対象者が限定された研究の結果でも、共変量を調整したうえで異なる集団に一般化したり、個人に適用する場合には、価値観による調整も行ったうえで、結果を適用することは可能である。そのさいに、数理統計学的モデルは手助けしてくれるが、必ずしも絶対的な基準とはならない。」

誤解3. もし回帰モデルで、2つの因子の積が統計学的に有意でなければ、これらの因子の間に生物学的な相互作用はない。

  統計学的交互作用と生物学的相互作用は異なる。生物学的相互作用は2つまたはそれ以上の原因が同じメカニズムに作用し、相互に依存関係がある効果を持つことである。2つの原因となる因子が同時に作用した場合、個別の作用の合計とは異なる効果になる場合、生物学的相互作用がある。生物学的相互作用は必ずしも統計学的交互作用としてとらえられないこともあり、用いられるモデルや測定尺度の影響を受ける。 

誤解4. 連続変数を分類するとき、分類のカットポイントに分布の4分位あるいは5分位のようなパーセントによる境界を用いることは妥当な方法である。

  ひとつには、パーセンタイルによる境界値は生物学的な意義のある変化が起きる値とは異なり、二つ目には、パーセンタイルに基づく境界値は研究間で異なるので、必ずしも妥当な方法ではない。  

誤解5. 常に、多重比較で調整されたP値または信頼区間を報告すべきである。

  多重比較のType I errorを減らすための調整はType II errorの増加を伴い、本当は差があるのに、差がないという結論を出す可能性が高くなる。生物学的データを解析する場合、すべてがランダムな値であるという前提よりも何らかの差があることが前提の場合が多い。機械的に多重性の調整を適用する前に、事前情報から事前分布を想定することが必要である。ベイジアンアプローチを用いることがより防御的な方法である。

「ゲノム解析のような場合は、ランダムな配列を前提とするので、多重比較の調整を行うことに妥当性があるが、治療効果に真に差がある場合には、Type II errorが起きうるが、Type I errorは起こらない。解析の文脈が重要になる。もし、ベイジアンアプローチを用いれば、その研究までの事前情報に基づいて、事前分布を設定することができるので、多重比較によるType I errorが起きにくくなる。」

誤解6. 有意差検定はデータの解釈に有用で重要である。

  理想的には効果量effect sizeの大きさを推定し、それを歪める可能性のあるエラーを分析する必要がある。交絡のような系統的なエラーは分析的な方法(多変量解析の共分散の調整など)で対処でき、測定過誤あるいは選択バイアスは感度分析(バイアス分析と呼ばれる)で対処することができる。P値また信頼区間に無効果の値が含まれるかだけで結果を評価することは、研究結果の誤解を招く可能性がある。

*なお、Modern Epidemiologyの第3版は2018年に出版されていますが、第4版が2021年に出版されました。

**「」内は投稿者の意見です。

「全体として、統計学に対する誤解、生物学的な現象を深く考えることの軽視、臨床的な現象や臨床的な文脈の軽視、方法論に拘束された柔軟な思考の喪失、人の体験の全情報を測定することはできずいくつかのアウトカムに対する効果を見ているにすぎないことに対する認識の低さ、などがこれら誤解の背景にあると思います。」

R-bloggers

Rに関するブログを集めて紹介するR-bloggersというサイトがあります。英語でRに関する情報をブログで発信している人が、登録できるようになっています。また、メーリングリストも運営されており、参加すると適宜新しい情報がメールで送られてきます。Web siteで右サイドバーの上の方にSubscribe用のフィールドがあります。こちらは誰でも参加出来ます。

例えば、今日は”Animating U.S. COVID-19 hotspots over time”に関する情報が送られてきました。