Bayesian meta-analysis of DTA with imperfect reference standard

診断精度研究Diagnostic Test Accuracy (DTA) Studyでは参照基準が完全であること、すなわち参照基準の感度・特異度が100%であることを前提として、インデックス診断法の感度・特異度を求めているが、実際には参照基準が不完全な場合が多い。 参照基準が不完全な場合には、参照基準で陽性と判定された例には、偽陽性の例が含まれるため疾患群には非疾患群の一部が含まれるとともに、陰性と判定された例には、偽陰性の例が含まれるため非疾患群に疾患群の一部が含まれてしまう。そのため、有病率を直接知ることができなくなるとともに、参照基準で分類された疾患群、非疾患群における評価診断法の感度・特異度は真の値の推定値とはなりえないことになる。

また、メタアナリシスで感度・特異度の統合値を算出する場合、研究によって異なる参照基準が用いられている場合もある。また、インデックス診断法と参照基準の間に相関がある場合はそれによる値の調整が必要である。このような場合に対処可能な、ベイジアンアプローチによるメタアナリシスの手法、BUGSコード、RスクリプトがDendukuri Nらによって報告されている。Nandini Dendukuriは自身のウェブサイトでこれらの情報を公開している。

Dendukuri N, Schiller I, Joseph L, Pai M: Bayesian meta-analysis of the accuracy of a test for tuberculous pleuritis in the absence of a gold standard reference. Biometrics 2012;68:1285-93. PMID: 22568612

Dendukuri N, Joseph L: Bayesian approaches to modeling the conditional dependence between multiple diagnostic tests. Biometrics 2001;57:158-67. PMID: 11252592

彼女の作成したBUGSコード、Rスクリプトにさらに、Forest plotを作成するRスクリプトを追加し、データをExcelで用意すれば、一度に解析を実行し、結果を出力するウェブツールを用意した。useRsのメタアナリシスの#5. Dendukuri Nのモデルを用いるR、BRugs、OpenBUGSによる診断精度(Diagnostic Test Accuracy, DTA)研究のベイジアンメタアナリシスである。実際のデータ処理は自分のPCでRとOpenBUGSで行うので、あらかじめRとOpenBUGSのインストールが必要で、さらにRのパッケージでtcltk2、BRugs、forestplotが必要である。これらのパッケージはPのスクリプトを最初にRで実行すれば自動でインストールしてくれる。 これらのパッケージの作者その他の情報についてはuseRsを参照していただきたい。

これらについては以前、国際医学情報センターの医学情報誌のあいみっくに発表しているのでそれらも参照されたい。
森實敏夫:医学統計学シリーズ第46回 RとOpenBUGSによる診断法のベイジアンメタアナリシスからForest plot作成まで。2018年6月。
森實敏夫:医学統計学シリーズ 第26回 参照基準が不完全な場合の診断法のメタアナリシス。2013年9月。
森實敏夫:医学統計学シリーズ 第25回 診断法のベイジアンメタアナリシス。2013年6月。

Patient preference information – Best-worst scaling exercise

FDAのRegulatory ReviewにおいてPatient preference informationが重要になってきています。患者の選好に関する研究Patient preference studiesも盛んになってきており、患者の選好を測定するさまざまな方法が報告されています。

1. Validity and Reproducibility of Existing Methods.
2. Effect of Method Choice on Study Results.
3. Effect of Sample Composition on Study Results.
4. Effect of Attribute Inclusion or Exclusion on Study Results.
5. Effect of Communication Style and Methods on Study Results.

これらの項目について現時点での課題と、将来の発展について Levitan BらがPatientというジャーナルのEditorialで述べています。
Levitan B, Hauber AB, Damiano MG, Jaffe R, Christopher S: The Ball is in Your Court: Agenda for Research to Advance the Science of Patient Preferences in the Regulatory Review of Medical Devices in the United States. Patient 2017;10:531-536. PMID: 28831745

以前の投稿で述べましたが、List of methods included in the Catalog に、Preference選好の評価法に関してさまざまな方法がまとめられています。
Ho M, Saha A, McCleary KK, Levitan B, Christopher S, Zandlo K, Braithwaite RS, Hauber AB, Medical Device Innovation Consortium’s Patient Centered Benefit-Risk Steering Committee: A Framework for Incorporating Patient Preferences Regarding Benefits and Risks into Regulatory Assessment of Medical Technologies. Value Health 2016;19:746-750. PMID: 27712701

Ho Mらの論文の方法の一覧表にも出ていますが、Peay HLらによると、Best-worst scaling exercises 最善最悪スケーリングエクササイズはStated preference表明選好に分類され、Conjoint analysis and discrete-choice experiments コンジョイント分析および離散選択分析よりも理解しやすく簡単に施行できるということです。
Peay HL, Hollin I, Fischer R, Bridges JF: A community-engaged approach to quantifying caregiver preferences for the benefits and risks of emerging therapies for Duchenne muscular dystrophy. Clin Ther 2014;36:624-37. PMID: 24852596

複数のAttributeあるいはアウトカムに2-3個のレベルが設定され、それらを数個ずつ組み合わせ、すべての組み合わせについて、評価者に最善と最悪の項目を選ばせて、解析し、重要度をスコア化する方法です。Peay HLらの論文では簡単な集計でも信頼できる結果が得られると述べられています。

Louviere JJ, Flynn TN, Marley AAJ : Best-Worst Scaling: Theory, Methods and Applications. 2015, Cambridge University Press.の著者のひとりであるFlynn TNはBest-worst scaling exercisesの第一人者のようです。