連続変数を二値化したスコアにする:閾値による割合スコア

連続変数を標準化することで、0~1の範囲の値に変換し、異なるアウトカムに関する効果推定値を互いに比較できるようにする方法について解説しました。もし、正規分布に従うことを仮定できるのであれば、閾値を設定して、曲線下の面積を比較することで、効果の大きさを表すことができるはずです。対照に対する介入の正味の益を計算したい場合、二値変数アウトカムと連続変数アウトカムの両方ある場合、連続変数を二値化したスコアにすることで、望ましい効果が得られた、あるいは、望ましくない効果が起きた対象者の割合を表すことができ、二値変数アウトカムと同じように扱えるはずです。そのアウトカムの重要度の設定もやりやすくなるはずです。


例えば、対照群と介入群の平均値と標準偏差から、望ましい値の下限値を閾値として設定すると、介入により、望ましい値の範囲に含まれる対象者の割合の変動を計算することができます。つまり、対照群と介入群の、絶対リスクの値と標準偏差の値が、分かれば、例えば、Rでの関数はpnorm(閾値,平均値,標準偏差)、あるいは、Excelでの関数はNORM.DIS(閾値,平均,標準偏差,TRUE)を用いて計算することができます。

Rのスクリプトであれば、以下の様に記述できます。

S=(1-pnorm(Th,Eik,SDik))-(1-pnorm(Th,Ejk,SDjk))=pnorm(Th,Ejk,SDjk)-pnorm(Th,Eik,SDik)

Excelの式であれば、以下の様になります。

=(1-NORM.DIST(Th,Eik,SDik,TRUE))-(1-NORM.DIST(Th,Ejk,SDjk,TRUE))

すなわち、

=NORM.DIST(Th,Ejk,SDjk,TRUE)-NORM.DIST(Th,Eik,SDik,TRUE)

閾値による割合(PD)スコアは、もし対象と介入の平均値が同じで、標準偏差も同じであれば、0になります。一方、介入の平均値が正常の平均値になれば、ほぼ1になります。あり得る最小値は0、あり得る最大値は1です。*PD: Proportion Difference

スライドの例は、血清アルブミン値のように、値が大きい方が望ましい連続変数アウトカムです。

例えば、HbA1cの様に、値が小さい方が望ましい連続変数アウトカムの場合は、閾値は正常の上限値に設定するか、臨床的に意義のある値に設定し、以下の式で割合(PD)スコアが計算できます。スライドに示す、値が大きい方が望ましい場合の計算で得られた結果の正負を逆にするのと同じ値になります。

Rのスクリプト:
S=pnorm(Th,Eik,SDik)-pnorm(Th,Ejk,SDjk)

Excelの場合:
=NORM.DIST(Th,Eik,SDik,TRUE)-NORM.DIST(Th,Ejk,SDjk,TRUE)

閾値Thは臨床検査の様に基準値が設定されている場合は、それを用いることが考えられます。また、介入により基準値の範囲にまで、改善することではなく、臨床的に意味のある値を、閾値に設定することも考えられます。

閾値を設定して、望ましい値の範囲に含まれる対象者の割合が介入によりどれだけ増加する、あるいは、減少するかをスコアとして示すことで、二値変数アウトカムの場合のリスク差と同じように取り扱うことができます。アウトカムの重要度の設定も相対的な比較がより容易になると考えられます。

標準化で得られる値は、sjk=0.687, sik=0.726, Sij=0.0393と全く異なります。


連続変数に対して閾値による割合(PD)スコアおよび二値変数はイベント率から正味の益を計算するためのExcelの計算表:あくまで参考資料で、完成版ではありません。。いろいろ値を入力して試すのは構いません。

URL: https://info.zanet.biz/lec/srsz/mcda_score_weight/abs_risk_prop.xlsx

(右クリックしてダウンロードして用いてください)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

JPEG PNG TIFF file attached

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください