いよいよ予測モデル研究に改めて正面から取り組むことになりました。1本完成して投稿中ですが、より規模の大きな研究になるので、改めて勉強しなおしながらbestを尽くそうと思います。やっぱり何はともあれSteyerberg先生の黄色い本から。まずは

 3.3 Predictors and Outcomes
 3.4 Reliability of Predictors

の記載で目に留まったところを(自分の解釈で)まとめておきます。

【予測変数あれこれ】
・強い予測変数の要件は効果量×分布
 - オッズ比2.5で1%の変数より、オッズ比2.0で50%の変数の方が強い
・重要な変数は定義にばらつきがなく、欠測がないことが望ましい
・予測変数のカテゴリは以下
 - 背景因子、重症度、既往、並存症、身体機能、健康状態/QOL
 - 環境因子、個人因子、疾病因子に分類することも
・高価だったり侵襲的な予測因子は基本モデルには含めない
 - 必要に応じて増分として利用

【予測変数の信頼性】
・検者内/検者間のばらつきは、一般化可能性の面で重要 
 - κ値として定量化される
・血圧などの生物学的変動にも注意
 - 測定方法や時期を明確にし、複数回測定する
・ただし、信頼性が低い変数でも、実臨床で使う変数は許容すべし
 - 理想的ではないかもしれないが、実用的なモデルになる

【コメント】
とりあえずはそりゃそうだろ!という内容でしたが、知識に芯を入れる意味ではやっぱいい教科書だと思います。全体的に総論的な感じで手を動かす感じじゃないので、この本だけでは完成しない…まぁまずは総論ということでコツコツ進みます。次は本当に知りたい「変数選抜」について。