ランダム化比較試験で2つの治療選択肢の効果を比較する場合、ひとつのアウトカムに対して、アウトカムが二値変数Dichotomous variableであれば、いわゆる四分表 two-by-two table、 2×2 tableにデータをまとめます。
四分表はクロス集計表のひとつです。クロス集計表は二つのカテゴリー、例えば、男性と女性でいくつかのカテゴリーに分類される変数、例えば、好きなスポーツ、について度数を集計したような場合に作成されるものです。四分表ではその変数が二つのカテゴリーに分類される場合のクロス集計表に相当することになります。
例えば、このような表です。a, b, c, d, nt, ncは人数を表します。
アウトカム(+) | アウトカム(-) | 症例数 | |
介入群 | a | b | nt |
対照群 | c | d | nc |
診断精度に関する研究の場合も、対象者が疾患あり、なしの二値変数で分類され、診断検査法の結果が陽性・陰性の二値変数の場合は、同様に四分表で結果を表し、診断能の指標である感度・特異度が算出されます。
陽性 | 陰性 | 症例数 | |
疾患群 | a | b | nd |
対照群 | c | d | nc |
このように四分表はさまざまな分析で活用されますが、単純化され、分かりやすいという利点があります。ランダム化比較試験で介入の効果を表すために効果指標としてリスク比、オッズ比、リスク差などが計算されますが、上記の四分表のデータであれば以下の様に計算されます。
リスク比 = [a/(a + b)]/[c/(c + d)] = (a/nt)/(c/nc)
オッズ比 = (a/b)/(c/d)
リスク差 = a/(a + b) – c/(c +d)
これらの効果指標の95%信頼区間を計算し不確実性の評価ができますし、アウトカム(+)の割合に差が無いという帰無仮説に対するP値を計算することもできます。
四分表は単純化されているという点について少し考えてみましょう。ランダム化比較試験の例について元データはどのようなものか考えてみます。元データは、個人個人のデータを1行に集計します。それを症例数分集めます。上記の四分表のデータからは以下の様な元データが復元できます。アウトカムは1がアウトカム(+)、0がアウトカム(-)を意味します。もし各群で平均値を計算 すると、アウトカム(+)の症例の割合が得られます。
症例番号 | 治療 | アウトカム |
1 | 介入 | 1 |
2 | 介入 | 0 |
3 | 介入 | 1 |
介入群の症例数nt人分の行が続く: 1がa人、0がb人
例えば51 | 対照 | 0 |
52 | 対照 | 0 |
53 | 対照 | 1 |
対照群の症例数nc人分の行が続く: 1がc人、0がd人
さて、治療選択肢とアウトカム以外のそれぞれの個人の属性についてのデータはここでは含まれていません。治療選択肢が2つ、アウトカムが2つの値をとる変数であるため、クロス集計表を作成すると四分表になります。その他の、それらの属性の中にアウトカムに影響を与える因子が含まれているのが普通です。たとえば、年齢はさまざまな疾患で生存を含め、さまざまなアウトカムに影響を与えるはずです。もし年齢が介入群で対照群より若い場合、結果は介入群に有利に働く可能性が高くなります。
実際には元データは以下の様にさまざまな属性のデータを含んでいます。病期、重症度などもアウトカムに影響を与えるでしょう。
症例番号 | 治療 | アウトカム | 性別 | 年齢 | 病期 | 重症度 | その他・・・ |
1 | 介入 | 1 | 男性 | 55 | I | 1 | ・・・ |
2 | 介入 | 0 | 女性 | 75 | II | 2 | ・・・ |
3 | 介入 | 1 | 女性 | 62 | I | 1 | ・・・ |
介入群の症例数nt人分の行が続く: アウトカム1がa人、0がb人
例えば51 | 対照 | 0 | 女性 | 70 | II | 2 | ・・・ |
52 | 対照 | 0 | 男性 | 83 | II | 2 | ・・・ |
53 | 対照 | 1 | 男性 | 74 | I | 1 | ・・・ |
対照群の症例数nc人分の行が続く: アウトカム1がc人、0がd人
これらの因子を無視して介入の効果を証明することは可能なのでしょうか?もし可能だとしたら、ランダム割り付けが適切に実施され、介入群と対照群でこれらの因子、すなわち背景因子についてバランスがとれていることが前提として必要になります。
実際には、ランダム化を危うくするバイアスがあり、例えばコンシールメントがされていない場合がそれに該当します。コンシールメントは担当医が割り付けを予測できないようにすることで、例えば、中央管理で割り付けが通知されるような方法がとられていれば、コンシールメントは守られ、他のバイアスがない場合には、ランダム化が確実になると言えます。
観察研究では背景因子のバランスを取るために、傾向スコア解析Propensity score analysisや操作変数法Instrumental variable methodなどが用いられることがありますが、未知の因子についてはバランスを取ることはできないため、ランダム化の達成には限界があります。
ここでいう背景因子は交絡因子に相当するものです。つまり、割り付けとアウトカムの両方に影響を与える共通因子です。交絡因子の影響はデータ解析の時点である程度調整が可能で、そのためには多変量解析が用いられます。多変量解析では各説明変数間の相関も加味されてそれぞれの変数の介入の効果への関わりの程度を知ることができるとともに、それらで調整された介入の効果を知ることができます。ランダム化比較試験でも多変量解析が意味を持つ場合があります。
四分表を用いて解析をする際には、元データを想像することが重要だと思います。四分表だけを見ているとそれを忘れがちです。
アウトカムが二値変数であれば、異なるアウトカムに対して、それぞれ四分表を作成することができます。しかし、それら四分表のデータから元データの表を復元することはできません。それら因子の間の相関については、個別の四分表からは知ることができません。
相関を知りたい変数のデータが個々の症例について必要になります。データ収集の際にはこの点も認識しておく必要があります。これは複数の診断検査を診断に用いる場合には、個別の診断検査の感度・特異度だけでは不十分であり、それらの共分散(あるいは相関)のデータが必要であるということとも関係しています。
また、アウトカムのカテゴリーが3つ以上、治療のカテゴリーが3つ以上の場合は、2×3や3×3になったりします。2×2は一番単純で、解析もより容易ですが、オールマイティ―というわけではありません。