脊椎外科の最新論文を定期的に読むことには慣れてきたかなと思います。が、進歩するためにはしんどいけど疫学の論文を読まないと!これまでに勉強するたびにJ Clin Epidemiol(JCE: 2021IF7.4)の論文に行きつくので、定期的にJCEをcheckすればきっとためになるはず…ということで、まずはちょっと旧いですが2019年の「Table 1.の書き方」の指南論文から。
Who is in this study, anyway? Guidelines for a useful Table 1
長くなるのでまず学んだことのサマリーを…図は勝手に自分で作ったひな型です。
【コホート研究×因果推論で推奨されるTable 1】
・列(Column)に書くこと
- 全体+欠測なし+(補完)+暴露で解析対象を層化
・行(Row)に書くこと
- アウトカム、交絡因子、その他(潜在交絡)
- 効果修飾因子、研究参加や脱落に関係する因子も
- 連続値をカテゴライズした場合はどちらも
・P値は載せない
- P値を誤用して交絡を探す輩がいるので
これらは論文中のFigure 3に可視化されていてわかりやすいです。
*ここから先は以下は私の意訳
【まずはじめに】
外的妥当性や内的妥当性の評価にTable1は重要で、Table1をみればで交絡、選択バイアス、測定誤差が評価できる。でも最近臨床研究が多様になり、いいTable1を作るのが難しくなってきた。そこで因果推論を想定していいTable1の書き方を提案する(予測や記述研究にもいくらかあてはまる)。
【Table1の基本構造】
・行(Row)に重要な変数を入れた1列(column)の構造が基本
- 重要な変数は主解析に用いた変数+α
・各セルはカテゴリ値はn(%)、連続値はmean(SD)もしくはmedian(IQR)
・読者は研究対象が想像できるので、外的妥当性が評価できる
<列(column)を考える>
・重要な変数で層化してもよい(とくにExposure)
- 交絡が評価できる
- Eが連続値だとカテゴライズを要する
・症例対照研究の場合はOで層化
- 全体の表は不要(Oなしが母集団の代表)
- Oありが母集団から抽出されたか(選択バイアス)が評価できる
- 交絡をみたければOなしを更にEで層化
・P値は?(しばしばジャーナルから要求)
- P値で交絡かどうかはわからない(から不要)
- 有意差なし≠差なし
- 有意差あり≠意味のある差あり or 交絡あり
<行(Row)を考える>
・最終モデルに使った変数以外も入れるとよい
- 潜在交絡、抽出因子、参加や脱落の関連因子
- 残余交絡や選択バイアスがわかる
- 症例対照研究なら「病院までの距離」など
- 効果修飾因子もアリ
・生存時間解析の場合、総人年、各人の要約値、打ち切り変数も
- 打ち切り変数に差があれば情報打ち切り(内的妥当性の懸念)
- 各人の要約値で外的妥当性も評価できる
・連続値をカテゴライズした場合は両方のせる
<セルを考える>
・見やすくするためにシンプルに
- Nは行のheaderに回したり、%は丸めたり
・要約はmean(SD)が基本
- でもmedian+min/max+IQRが最も情報的
- 測定誤差、はずれ値の影響などがわかる
・データがなくても空白にはしない
【解析のために】
・欠測は選択バイアスをもたらす
- 列に「欠測のない完全例」を追加する
- 欠測と関連する因子がわかる
- 行にOがあると、欠測がOと関連するかもわかる
- 全体と完全例にE以外の差がなければ、完全例解析が妥当とわかる
・補完したなら、補完コホートの全体、Eあり/なしの列も
・重みづけをしたら重みづけ後のデータをみせる
- 対象者数、最大と最小の重み、重みの分布も
- 非重みづけN数と重みづけの割合を示すとよい
・個人レベルの特徴と、各クラスタの特徴をみせる
- 各クラスタと母集団の相違がわかる
- 各クラスタのN数とサンプリング率も記載
【コメント】
なるほど…全体と完全例をわけて、完全例解析でいいか?をみせるんですね~あとEで層化するのは全体ではなく、解析対象集団と。行にはモデルに入れた変数だけじゃなく、ほかの重要な変数や欠測に関連しそうな変数まで載せていいんですね。Oを載せるのも必須と。相当busyになりそう…その場合はSupplementにするのも考慮しなければ。あとP値は個人的には1週まわってアリだったんですけど、やっぱりナシか。でもあった方が読みやすいしなぁ~読者がP値を妄信しなければ悪影響も少ないはず!?
Who is in this study, anyway? Guidelines for a useful Table 1
長くなるのでまず学んだことのサマリーを…図は勝手に自分で作ったひな型です。
【コホート研究×因果推論で推奨されるTable 1】
・列(Column)に書くこと
- 全体+欠測なし+(補完)+暴露で解析対象を層化
・行(Row)に書くこと
- アウトカム、交絡因子、その他(潜在交絡)
- 効果修飾因子、研究参加や脱落に関係する因子も
- 連続値をカテゴライズした場合はどちらも
・P値は載せない
- P値を誤用して交絡を探す輩がいるので
これらは論文中のFigure 3に可視化されていてわかりやすいです。
*ここから先は以下は私の意訳
【まずはじめに】
外的妥当性や内的妥当性の評価にTable1は重要で、Table1をみればで交絡、選択バイアス、測定誤差が評価できる。でも最近臨床研究が多様になり、いいTable1を作るのが難しくなってきた。そこで因果推論を想定していいTable1の書き方を提案する(予測や記述研究にもいくらかあてはまる)。
【Table1の基本構造】
・行(Row)に重要な変数を入れた1列(column)の構造が基本
- 重要な変数は主解析に用いた変数+α
・各セルはカテゴリ値はn(%)、連続値はmean(SD)もしくはmedian(IQR)
・読者は研究対象が想像できるので、外的妥当性が評価できる
<列(column)を考える>
・重要な変数で層化してもよい(とくにExposure)
- 交絡が評価できる
- Eが連続値だとカテゴライズを要する
・症例対照研究の場合はOで層化
- 全体の表は不要(Oなしが母集団の代表)
- Oありが母集団から抽出されたか(選択バイアス)が評価できる
- 交絡をみたければOなしを更にEで層化
・P値は?(しばしばジャーナルから要求)
- P値で交絡かどうかはわからない(から不要)
- 有意差なし≠差なし
- 有意差あり≠意味のある差あり or 交絡あり
<行(Row)を考える>
・最終モデルに使った変数以外も入れるとよい
- 潜在交絡、抽出因子、参加や脱落の関連因子
- 残余交絡や選択バイアスがわかる
- 症例対照研究なら「病院までの距離」など
- 効果修飾因子もアリ
・生存時間解析の場合、総人年、各人の要約値、打ち切り変数も
- 打ち切り変数に差があれば情報打ち切り(内的妥当性の懸念)
- 各人の要約値で外的妥当性も評価できる
・連続値をカテゴライズした場合は両方のせる
<セルを考える>
・見やすくするためにシンプルに
- Nは行のheaderに回したり、%は丸めたり
・要約はmean(SD)が基本
- でもmedian+min/max+IQRが最も情報的
- 測定誤差、はずれ値の影響などがわかる
・データがなくても空白にはしない
【解析のために】
・欠測は選択バイアスをもたらす
- 列に「欠測のない完全例」を追加する
- 欠測と関連する因子がわかる
- 行にOがあると、欠測がOと関連するかもわかる
- 全体と完全例にE以外の差がなければ、完全例解析が妥当とわかる
・補完したなら、補完コホートの全体、Eあり/なしの列も
・重みづけをしたら重みづけ後のデータをみせる
- 対象者数、最大と最小の重み、重みの分布も
- 非重みづけN数と重みづけの割合を示すとよい
・個人レベルの特徴と、各クラスタの特徴をみせる
- 各クラスタと母集団の相違がわかる
- 各クラスタのN数とサンプリング率も記載
【コメント】
なるほど…全体と完全例をわけて、完全例解析でいいか?をみせるんですね~あとEで層化するのは全体ではなく、解析対象集団と。行にはモデルに入れた変数だけじゃなく、ほかの重要な変数や欠測に関連しそうな変数まで載せていいんですね。Oを載せるのも必須と。相当busyになりそう…その場合はSupplementにするのも考慮しなければ。あとP値は個人的には1週まわってアリだったんですけど、やっぱりナシか。でもあった方が読みやすいしなぁ~読者がP値を妄信しなければ悪影響も少ないはず!?
コメント