忙しさを理由にサボってしますのですが、久しぶりにSpineの論文を読んでみます。現在諸事情で2本投稿中なのですが、番号が**088と**272で投稿間隔はちょうど3週間。すなわち、この期間に約9本/日も投稿がある!採択までいった研究は選ばれた勇者ですね。というわけで、やる気を奮い立たせて読んでみます。術前情報では術後アウトカムは予測できない!という敗戦宣言しながら採択されている点が興味深いです。

Baseline Patient Characteristics Commonly Captured Before Surgery Do Not Accurately Predict Long-Term Outcomes of Lumbar Microdiscectomy Followed by Physiotherapy

研究疑問  :除圧+リハビリの予後良好/不良群の予測モデル構築
研究デザイン:前向きコホート
セッティング:蘭単施設

*予後良好と不良両方の予測モデルを扱っていますが、予後不良のみまとめます

P 除圧+リハビリの腰神経根症 298人
E 各リスク因子あり
C 各リスク因子なし
O 主要:回復なし
副次:疼痛残存、障害残存(12M)


腰神経根症に治療は顕微鏡除圧+リハビリが標準だが、結構症状残って困る。ので、術前情報で予測するモデルと作りました!という研究。

【方法】
「回復なし」の判定はGPE尺度で全快 or 大改善以外
・「疼痛残存」はVAS20点~
・「障害残存」はRDQ5点~
・予測因子候補は3本のSRを参考に決定(最大21項目)
 - 背景、治療歴、症状所見、画像、職業
・サンプルサイズは10 thumb ruleで算出
 - モデルに入れる変数10、アウトカム35%で286人
・欠測は補完(アウトカムも)
・変数はbackward selection
・性能評価はHosmer–Lemeshow、R2、AUC
・bootstrappingでover fitを是正?

【結果と結論】 
・アウトカム欠測は15例(5%)
・回復なしは24%、疼痛残存は33%、障害残存は41%
・回復なしの予測モデル
 - 選択変数は教育レベル低、手術既往、L3/4
 - R2 0.06, AUC 0.63
・疼痛残存の予測モデル
 - 選択変数はブロックの既往、MRI変性あり
 - R2 0.04, AUC 0.6
・障害残存の予測モデル
 - 選択変数は年齢、手術既往、投薬既往、腰痛大、障害大、座位仕事
 - R2 0.18, AUC 0.72

というわけで、「通常診療で使うdata」で術後の予後予測をするのは無理!との結論。

【批判的吟味】★★
やりたいことも共感できるし、前向きに頑張って試行した点は賞賛しかありません。が、臨床予測モデルあるあるで、研究の質としては残念ながら低いです。なぜなら

<方法論の問題点>
・そもそも予後良好/不良の両方のモデルを作るのは反則
 - 単なる多重検定
・異なるアウトカムに同じ変数使うのは雑
・サンプルサイズ計算が甘い
 - モデルに入れる変数は21なので286例→600例
 - pmsampsizeで計算すると1000以上
・前向き調査なのに変数の欠測がある?
・性能評価が不十分
・内的妥当性の評価がヘン(bootstrappingで何をした!?)

<臨床的な問題点>
・臨床的意義がよくわからない
・予後不良の主因(診断間違いと適応間違い)が考慮されていない
 - 手術成績も悪すぎる
・術者の技量について触れられていない
 - 術者は何人で、手技やレベルに差はないか?
・変数の選定・測定が甘い
 - 予後予測因子が十分考慮されているとは思えない
 - 「通常診療で使うdata」も不十分
 - X線や神経根ブロックの情報は?
 - MRIでみるのは高位と椎間の変性だけ?
 - 罹患期間は?原因疾患は?

というわけで、予測するのは無理!なのか、研究の質が低すぎて無理!だったのかわかりません。研究から得られる知見は残念ながらほぼ無です。

【コメント】
「予測できないこと」を科学的に示すのは困難で、質が低い研究1本で示すことは不可能。得られる知見がほぼ無い研究が採択されるのは問題が…選ばれた勇者であることは間違いないのですが、実力で生き残ったわけではなく、運で生き残っただけでした。まぁぶっちゃけ運でも生き残りたいのも事実ですが。運は高めれないもんなぁ…