二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ:臨床研究 > ピットフォール

最近ただでさえキャパが低いところにお仕事引き受けすぎて、気を失いかけている間にもう4月が近づいて参りました。やればやるほど果てしない疫学の世界、臨床から離れて本来のコアバリューである「脊椎外科領域に研究デザイン学の普及」を見失わないようにしつつ、臨床も研究も前に進むしかありません。

という自己暗示はさておき、最近本当にあった怖い話を。

ハゲタカジャーナルはもう有名だと思うんですけど、知人が関わる研究で実害を受けたことを教えてもらいました。どうなったかというと

・著者が独断でハゲタカジャーナルに投稿
・著者から投稿報告を受け、共著者が確認しハゲタカジャーナルと看破
・即日投稿撤回の連絡したが音沙汰なし
・約10日で返事があり、もう査読開始したので〇〇万円払え!!

ほんまにあるんや...こわすぎる…

なんでハゲタカにやられちゃったのかといいますと
・雑誌の名前が格好いい
・IF高め

だからとの事。でもこのIFが曲者で、偽物だったようです。本来IFはWeb of Scienceでの被引用数を基に計算されるもの。でもGoogle Scholarなど、他のレジストリでの被引用数で計算するなんちゃってIFが載せられているそうです。私も最近Google Scholarに何となく登録してみましたが、古ーい日本語論文とかも全部でてきて、え?という私の実績からすると多すぎる引用数。コレならウ〇コみたいな論文とか記事載せまくって、自己引用しまくればなんちゃってIF3とかすぐ作れちゃいます…

完全に詐欺なのですが、偽IFとはいえ嘘ではない。自分で選択して自由意志で投稿しているわけなので、撤回は簡単ではなさそうです。なんせ論文を人質にとられてしまっているので、出版されでもしたら他に投稿できなくなっちゃうかも…後付けで見直すと、投稿した時点で査読料最低〇万円必要などちゃんと規定に書いてある模様。「最低」というのがミソで、事実〇倍に吊り上がったと…

対策としては
・由緒ある雑誌以外、HPにあるIFは信用しない
・というか、由緒ある雑誌以外投稿しない
・せめて名の知れた出版社にしか出さない
・投稿時は共著者にちゃんと確認をとる(オプトアウトでも)

しかありませんね。著者のはやく再投稿して楽になりたい、という心理に付けこみ、更に論文を人質にとって脅すという巧妙な手口。投稿料、審査料、掲載料、吹っ掛け放題だし、ホントよくできてます。気を付けよっと…

予測モデル研究をしていて、似たようなフレームの先行研究が見つかってしまいました。悲しい気持ちで細読していると、どうも解析があちこち間違っている。本邦発なので、キツイletter書くような強硬手段には出れません。そこでピンチを前向きなチャンスに変えれないか?と、基本を復習する契機にすることにしました。今回はまずロジスティック回帰について整理してみます。高校時代、理系なのに模試で学内141/142番をとったトラウマがある私の理解なので、間違っていたらホントすいませんが…大/小文字や括弧の使い方がヘンなのはご容赦を…

【なぜロジスティック回帰なのか】
あるアウトカムを可視化するために、数式を組み立てるのが統計モデリングです。そのためにはまずアウトカムがどういう分布をとるか?を考えます。臨床アウトカムの多くは死亡か生存か?など有/無の二値変数になり、ベルヌーイ分布に従います。ロジスティック回帰はこのベルヌーイ分布を説明するのに都合がいいため、よく用いられます。

【ロジスティック回帰とは】
分布の形状と位置を決める因子をパラメータと呼びますが、ベルヌーイ分布を決めるパラメータは「Y=1となる確率P」のみです。すなわち、ベルヌーイ分布に従うデータはPの関数として数式で表すことができます。患者iごとにPは異なり、その確率はX1, X2, X3の3つの変数で説明できるとします。するとPi
 P= 1 / (1 + exp [ -{α+β1X1i+β2X2i+β3X3i}])

という数式で説明できます(誰が考えたんだ…)。そしてこの式を変換すると
 Pi / (1-Pi) = exp (α+β1X1i+β2X2i+β3X3i)

になり、更に対数をとると
 log Pi / (1-Pi) = α+β1X1i+β2X2i+β3X3i

になり、Pの関数である log Pi / (1-Pi) が、α+β1X1i+β2X2i+β3X3i という直線式で説明されちゃいます。こうなると、最小二乗法で手元のデータから定数である α や β1-3 が算出されてきます。ちなみに log Pi / (1-Pi) をロジットと呼びます。

【ロジスティック回帰の使い方①~交絡調整】
X1(二値変数とします)とアウトカムがどの程度関連するか?を可視化したい、しかしX2とX3という交絡因子があるためこれらの影響を除外(調整)しなければいけない、という(あるある)例を考えます。まず最初に、アウトカムとX1-3の関係を説明する先述の式が再登場します。
 Pi / (1-Pi) = exp (α+β1X1i+β2X2i+β3X3i)

この式では、なんと左辺がオッズになっています(考えた人天才…)。なので、X1=1のときとX1=0のときのオッズはそれぞれ、ごちゃごちゃするので添え時は削除…
 P/ (1-P) = exp (α+β1+β2X2+β3X3)
 P/ (1-P) = exp (α+β2X2+β3X3)


になります。なのでX1=0を基準としたX1=1のオッズ比は
 OR(X1) = exp (α+β1+β2X2+β3X3) / exp (α+β2X2+β3X3)
         = exp (β1)


になり、 なんとβ1の真値をとれば、X2とX3から独立したX1のオッズ比になるのです(誰が発見したんだ…)。

ロジスティック回帰の使い方②~予測
X1-3というリスク因子がわかっていて、これらの因子を用いてアウトカムを予測したい(アウトカムの発生確率を算出したい)場合を考えます。ここで登場する式も先述の、
 P= 1 / (1 + exp [ -{α+β1X1i+β2X2i+β3X3i}])

です。α・β1-3は定数ですので、上記の式にX1-3の値を挿入したらそのままアウトカムの発生確率がでてきます。例えばスコアリングシステムを作った場合の数式は、
 log Pi / (1-Pi) = α+βScorei

になります。これを変換すると、
 P= 1 / (1 + exp [ -{α+βScorei}])

になります。この式にScore値を入れると、Score毎の予測確率が算出できます。

【まとめ】
私もそうでしたが、ちょっと臨床研究をかじると、「格好いいから多変量解析」「二値変数だからロジスティック」とよくわからないままロジスティック回帰を使うのがフツーだと思います。ただ、ある程度理論がわかっていないと簡単に間違ってしまいます。こんな場末のク〇ブログですが、少しでも現状の改善のために役立てば...と地道に続けようと決意を新たにする今日この頃…ちなみにCox回帰のCox先生がロジスティック回帰も開発したとの事…ゴイスー!ちなみに96歳でご存命…

【たまには本の紹介】
内容は1/100も理解できていませんが、色々な分布が紹介されていたり、統計モデリングを勉強するために入口となるような良書です。院生の多くが購入するのをしり目に、数式アレルギーの私は題名みて長らく敬遠していたのですが、もっと早く買うべきだったと後悔しております。



論文を仕上げたのはいいけど、共著者に誰を入れるか?で頭を悩ませることが多いと思います。なぜなら、実質ほぼ一人で行った研究にも、同僚や上司の名前を入れるいわゆるギフトオーサーシップが蔓延しているからです。実績(h-indexも著者順は関係なくカウント)、資格取得や維持が関係する非常にデリケートな問題で、載せないと恨まれたり、自分の立場が悪くなるんじゃないかという恐怖がある本当に面倒くさい問題。しかも、近年のちゃんとしましょう!という流れを受けてか著者数に制限を設ける雑誌が多く、かえってややこしい(例えばJBJSは原則6人、BJJは8人)。

最近お問合せをいただいたので、ちょっと整理しておきます。以前著者の役割という記事を書きましたが、どの程度の役割を果たせば共著者になるんでしょうか。実はちゃんと決まりを作って無駄なところにエネルギー使うのやめましょう!と1997年にCommittee on Publication Ethics: COPE という団体が英国で発足しています(とSPHの授業で習いました)。このサイトを進んでいくと、共著者を決めるガイドラインがfreeでダウンロードできます(2003年度版とちょっと旧いですが)。ざーっとまとめます。

<著者の資格>
・ 研究立案とデザイン、データ取得 acquisition、データ分析と解釈のいずれかに実質的貢献がある
・原稿作成や内容の大幅改定を行う
・最終稿の出版に同意する
・これら満たす者が著者
・ファンド獲得、データ収集 collection、研究グループの統括は著者資格とは別

<著者問題で頭を悩ませないために>
・研究開始から議題にあげ、記録する
・原稿を完成するまでに、誰がいつ何をするかの情報を共有記録する
 - 筋違いの期待やコミュニケーション不足から問題が生じるので

<揉めたらどうするか>
・「実質的な貢献」の判断は難しく揉めやすい
 - 上司に著者の出し入れを指示されたら、エビデンスを示して自分の考えを通す
 - それでも指示されたら、もっと上に泣きつく
 - でもほんとにそうする前に忠告する
・倫理的不正を持ちかけられた際には究極の決断
 - 黙って従う?キャリアを犠牲にして正義を通す?
 - どっちもきついので、別の方法をとりましょう
 - 雑誌に不正として指摘される可能性を伝える
 - そうなったらacceptされないけどいいんですか?

【コメント】
臨床研究を学び始めてから、日本語1編、レター1編、英語3編書きましたが書くことに必死で著者問題は棚上げしてました。メンター先生方とボス(ちゃんと研究立案段階からみていただいている)が入るのは暗黙の了解で決まっていて、あとは原稿完成してから貢献が高い方に共著に入っていただくことを改めてお願いして、原稿の改訂に加わっていただくと。基準は満たしていますので、このやり方で問題はないようです。でも揉めないためには研究立案段階からある程度決めて記録しておくべきでしょうか。てか更に上に泣きつくとか、過激すぎて日本ではちょっと無理でしょ…訳あってんのかな…

先日査読者とのやりとりの記事で査読者からのコメントと対策をまとめましたが、引っかかった点があり。投稿している論文では主解析をComplete-case-analysis(CCA)にして、欠測をMultiple-imputation-analysis(MIA)で補完して感度解析にしていたのですが、「MIAはよくわからないのでOmitしろ」「CCAは感度解析にまわせ」との指摘があり、じゃあ主解析はどうすればいいんだろう…と悩んだわけです。誤解なら申し訳なさすぎますが、統計ソフトで解析する際はデフォルトでCCAになっていることをご存じなかったのかもしれません。

というわけで、欠測の取り扱い方法について。私は以前BMJの記事を読んで勉強したので、サラッと紹介しつつ、自分の理解を加えてまとめておきます(のでズレてたらすいません)。ちなみに後半部分はMIの各論になるので、本記事ではその手前まで。

Multiple imputation for missing data in epidemiological and clinical research: potential and pitfalls

【欠測メカニズム】
Missing completely at random (MCAR)
欠測は完全に偶然おこる
→欠測あり/なしで欠測変数の分布は同じ

例:血圧計が壊れて測定できなかった
→欠測あり/なし群の真の平均血圧は等しい

Missing at random (MAR)
欠測は偶然ではない
でも欠測は欠測変数とは関係ない原因でおこる
ので頑張れば欠測の原因がわかる
→欠測あり/なしで欠測変数の分布は異なるが、別の変数で説明可能

例:若者は面倒臭がって血圧を測りにこない
→欠測あり群の真の平均血圧はなし群のそれより低い
→でも「若者」の情報を用いて欠測あり群の平均血圧は推測可能

Missing not at random (MNAR)
欠測は偶然ではない
そして欠測は欠測変数の関係した原因でおこる
なので欠測の原因はどう頑張ってもわからない
→欠測あり/なしで欠測変数の分布は異なり、別の変数で説明できない

例:血圧高く頭痛がある人は血圧を測りにこない
→欠測あり群の真の平均血圧はなし群より高い
→「血圧高く頭痛」の情報は得られないので、推測もできない
←血圧測りにきてないので

【欠測メカニズムと適切な解析集団】
MCAR →適切な解析はCCA
欠測は完全に偶然に起こっているので、CCAでバイアスはない。そもそも欠測に特別な理由がないのでMIは使えない。(もしMCARが強く主張できるなら、)単純に欠測なし群のデータを補完する方がCCAより検出力の向上期待できる?

MAR →適切な解析はMIA *条件付き
欠測には理由があり、その理由がわかっているのでMIで欠測値が推測可能。CCAだと異質な欠測あり群のデータをそっくり落とすことになり、MIAよりバイアスが大きい。純粋にサンプルサイズもMIA>CCAなのでMIAの方が検出力が高い。しかし、あくまで①欠測の理由がわかる、②その理由となる情報が全て利用できる、という非常に強い仮定(とくに②は非現実的)を満たした場合のみ。実際は、MIA>CCAがいいかどうかはどのくらい①②が満たせてそうか?に依る。

MNAR →適切な解析はない(CCAでもMIAでもバイアス)

【まとめ】
何を主解析にすべきか?は理論上ははっきりしていて、欠測メカニズム次第ということになります。でも、現実的なところ欠測メカニズムはそもそも欠測してるんだからわかるわけない。多分こうだよね~と想像しつつ、一番ましな方法に落ち着くしかないです。というわけで、個人的な最適解は主解析をCCA / (できるだけ頑張った)MIAを感度解析だと考えています。ぶっちゃけ解析方法はCCAかMIAの2択ですし、「MARで欠測理由となる情報が全て利用できる」なんて無理…ですのでこれが一番素直かなと。

【コメント】
考えれば考えるほど、じゃーどうしたらええねん!と迷子になります。でもそうなんだから仕方ない。「Nを増やす偽装工作の意図で欠測は見て見ぬフリ」もしくは「欠測の存在を考えてすらいない」でTable1のN数と解析のN数が異なる論文はそこそこの雑誌でもよく見かけます。多変量解析に使用した変数だけでMIして、どうだMIAだぞ!と結果を主解析にもってくる論文も実は結構ムリ通してます。何が正しいかはわかりませんが、信念もって研究しなきゃなぁと思う今日この頃。という真面目な話はこのへんにして、この査読者、自分がわかってないの解析のせいにして統計家に相談しろとかほんとひどいっす…

先日読んだSpineの非劣性RCTで、非劣性マージンの出どころが書いていない!と軽くディスってしまったのですが、じゃあどうしたらいいの?とお問合せがあったので(勉強して)回答します。大好きなBMJやCore clinical journalさがしても適当な文献がなかったので、webで引っかかたover viewから。BJCP(2019IF3.7)なのでそれなりに信頼できそう!?

Defining the noninferiority margin and analysing noninferiority: An overview

【はじめに】
プラセボ対照試験は難しいので、新規治療は既存治療を比較対照とし、より優れているもしくは劣っていないことを検証することが多い。後者は「非劣性試験」であり、安全や安価などのメリットがある新規治療が、既存治療に効果でもそんなに劣らないことを検証する試験である。非劣性マージンは「臨床的に許容できる最大差」である。

【非劣性マージンとは】
非劣性マージンの決定は重要だが難しい。そして過半数の研究で出どころが述べられていないことが問題である。決め方は統計学的かつ臨床的に決める。先ず利用できるエビデンスをプールして既存治療の効果量と95%CIを決める。その点推定値もしくは95%CIの下限を基準値(M1)とする。そしてM1をどの程度残すかを臨床的に判断して非劣性マージン(M2)とする(例えば3/4残すならM2=[1-0.75] M1)。ただし、臨床的な判断基準はアウトカムの重大さ、既存治療の効果量、risk/benefitバランス、コスト、効果の持続期間など多岐にわたる。多くの場合(とくに死亡などの重大アウトカム)50%が採用されるが、90%という厳しいものもある。

【M1の決め方】
・Fixed-margin (95%-95%)法
 プールした95%CI下限をM1とする。
・Point-estimate法
 プールした点推定値をM1とする。既存治療の効果のばらつきを一定と仮定する。
・Synthesis法
 プールした点推定値をM1とする。既存治療の効果のばらつきを調整する。

【非劣性の判定は難しい】
M1の決め方を変えたり、M2でM1を何%残すかを変えると結果がかわる。また、アウトカムをリスク差にするか、リスク比にするかでも結果が変わる可能性に注意。

【コメント】
治験の結果を審査する側の視点にたった、わかりやすい総説でした。もし今後自分で非劣性RCTにかかわることがあれば、M1の決め方はもうちょっと踏み込んで勉強しないといけないですが。あと試験する前には、客観的に適当なデザインになっているか確認するためにもプロトコル論文はマストですね。非劣性試験は余裕で操作できる!ので、相当カチッとした研究じゃないと信用できなぁ~と改めて思います。

このページのトップヘ