最近いろいろな場面でROC曲線を解析に使った研究を目にしました。多くが疫学を3年半学んでみたことがない手法だったので、ちょっと整理してみます(間違ってたらほんとすいません)。

【ROC曲線とは】
Receiver-Operator Characteristics(ROC)曲線とは下図のような曲線です。連続値変数で、あり/なしの2値アウトカムを予測したい場合に用います。カットオフ値で連続値を陽性/陰性にわけ、感度/特異度をだします。そしてカットオフ値を動かして(感度特異度を動かして)、X軸に1-特異度/Y軸に感度でグラフ化したものがROC曲線です。具体的な使い方としては、以下の2つになるかと思います。

 ①その連続値の識別力を示す
 ②カットオフ値をさがす

ROC

【ROC曲線で識別力を示す】
この場合には、Area Under the Curve(AUC)を計算します。AUCは0.5から1の値をとり、1に近づくほど「その連続値はよくアウトカムを説明できている=識別力が高い」ということになります。臨床研究でよく使うのは、ロジスティック回帰です。

ロジスティック回帰では、対象ごとの「アウトカム発生予測値(0~1)」が算出されます。その「アウトカム発生予測値」のカットオフ値を0.5にしたら、0.5以上が陽性、0.5未満が陰性に判定され、対象は陽性/陰性に2分されます。すると陽性/陰性判定と真陽性/真陰性の2×2表ができて、感度/特異度が計算できます。カットオフ値を0から1まで動かすとROC曲線が描けますので、AUCを計算すれば、「そのロジスティックモデルの識別力」が数値化されるわけです。臨床予測モデルはロジスティックモデルで作ることが多いので、ROC曲線は臨床予測モデルの性能評価の一手法として普及しています。連続値単変数の識別力の尺度としても使えないことはないですが、単変数でアウトカムばっちり予測できるとは考えられないので、臨床予測モデル以外ではあまり使いません。

【カットオフ値をさがす】
この場合には、ROC曲線を描いて一番突出した点(感度+特異度が最大になる点)を探すことになります。その点が一番アウトカムを予測できると。ただ、何より大切なのは「その予測をどういう目的で行うか」です。すなわち、スクリーニングに使いたいのか?確定診断に使いたいのか?です。感度と特異度はトレードオフなので、スクリーニングに使いたいなら感度を優先して、確定診断に使いたいなら特異度を優先すべきです。なので予測能が高いカットオフ値を探す臨床的意義はありません。そして、やっぱり単変数でアウトカムばっちり予測できるとは考えられないので、臨床研究ではあまり使いません。

【ROC曲線の誤用】
私が最近ROC曲線を使った研究にふれて感じた最大の違和感は、「予測と因果」が混同されている点です。臨床研究でよくみるのは「EがOのリスク因子かを検証=EとOの因果関係を検証」する研究かと思います。すなわち、EとOに因果関係があれば、Eに介入したらOが減らせるかもしれない!ので検証したいわけです。その場合には、EとOの関係を歪める交絡因子を調整した研究が必要です。ここに何故かROC曲線が登場している…これまで述べた通り、ROC曲線はAUCだして「予測」をみるために使う手法であり、因果関係はみれません。これは完全な誤用です。

【まとめ】
要するに、諸悪の根源は「その研究で何がしたいか」を研究者が自身がよくわかっていない点です。研究の芯が定まっていないまま何となく格好いい解析法が使われたら、読者は訳がわからない。でもこの問題は根が深いです…系統だった教育を受けないと、「予測と因果」なんて言われてもコイツ何言ってんの?という反応が普通。脊椎外科領域のEBMには危機感を感じます…