二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ:ひとり抄読会 > ★★★論文

相変わらずの要領の悪さ(能力の低さ?)のせいで遅々として論文執筆が進まず。最近論文を読んでいなかったので、今日は頑張って1本読んでみます。一緒に研究している先生から紹介していただいた、外傷を扱ったJBJS2018の論文。JBJSも観察研究とるんだ~しかもアメリカじゃないし、という点が興味深い。ド素人なので、臨床的意義はさておき、methodologyに注目してみます。

Association Between Distal Radial Fracture Malunion and Patient-Reported Activity Limitations: A Long-Term Follow-up


研究疑問  :橈骨遠位端骨折の変形癒合とアウトカムの関連をみる
研究デザイン:前向きコホートの二次利用
セッティング:北東Scania在住者(SWE)

P 橈骨遠位端骨折 63人
E 変形癒合
C 癒合
O 主要:DASHの変化量
副次:DASH値、VAS値(痛み、満足度)、ROM、握力
*DASH:Disabilities of the Arm, Shoulder and Hand
 30項目で0~100点(高いほど不良)、MCID=10

橈骨遠位端骨折の長期予後をみた研究は殆どない。2001~2002年に橈骨遠位端骨折に対しCastと経皮固定を比較した研究したけど、その長期成績を変形癒合とアウトカムに注目して報告します!という研究。

【方法】
・もとコホートの生存者から以下を除外
 - 重度並存症、認知症、再骨折、etc
・変形癒合の定義は割愛…(よくわからんので)
・まず質問票でDASHとVAS測定
 - その後検診でROMほか調査
・先行研究の1年成績をもとにサンプルサイズ計算
 - 変形癒合のDASH平均値25(SD17)、差15点の検出
 - 片群21人
 - 実際は対象100人の見込み、追跡7割を想定
 - 変形癒合3割なら、このサンプルサイズは十分との主張
・主解析は治療法で?層化したGEE
 - 年齢、性別、利き手、骨折型
 - 測定時点はベースライン、2年、最終観察を使用
 - 1時点での欠測ありも包含(他の時点値を代入?)
・67歳以下に限定したサブグループ解析も施行
・副次解析は線形回帰、などなど

【結果と結論】 
・潜在対象者97人のうち、生存88人が対象
 - 回答は80人(82%)
 - 検診まで受けたのは63人(65%)
・解析対象者63人中変形癒合は25人(40%)
・変形癒合 vs 癒合は
 DASH変化量差 11 (4, 17)
 DASH値差 14 (7, 22)
 疼痛VAS 10 (0, 20)
 満足度VAS 26 (11, 41) etc
 
で、変形癒合のほうが長期成績は悪そうですよ、との結論

【考察のまとめ】
・両群にはMCIDを超える差がみられた。
・標準治療は内固定にシフトしているけど、まだギプスとか経皮固定がある。
・変形癒合は長期成績が悪そう。本研究はCastと経皮固定のみが対象だけど。
・OAと成績の話(結果とあまり関係ないし、割愛)
・強みは長期予後をみた初めての研究
・欠測が結構あった
 - でも欠測者の特徴は参加者とかわらなかった。
 - GEEで欠測者もふくめ使えるdataを全て使った。
・健側のX線を行わなかった。
・CTではなくX線の評価なので、精度に問題があったかも。

【批判的吟味】★★★
正直な感想は、コレでJBJSに載るんだ…です。Common diseaseの術後長期観察ということで、研究の意義がとても大きいのはよくわかりますが、質はほぉ!というものでは…10年規模の追跡で6割以上が参加!という数値は素晴らしいかもしれませんが、3割以上が参加していない解析では選択バイアスが大きすぎます。健闘した!ってのは結果の解釈とは無関係ですから。あとMICDの解釈も変だし、数字や割合もちょこちょこ違ってそう(死亡者は包含しない、じゃなく包含して除外すべき)。欠測の取り扱いは曖昧だし(GEEで対処?詳細ナシ)。臨床研究部門から1人入ってるけど、ちゃんとした生物統計家なのかな…acceptされやすくするために仕込んでる?

【コメント】
Surgeryを扱う雑誌なので、やっぱりテーマは重要なんですね。最近疾患の予後研究をJNSに出したら、もっと疫学的な雑誌に出せや!と返ってきました涙。前向きに考えると、方法論的に最善を尽くしてなくとも、テーマがよくて先行研究がなければ整形領域ではTop Journalで勝負になる。必死で方法論の修行してもただの自己満足かも…と思うとちょっと虚しくなりますが、ドM精神発揮して進み続けるしかない。GEEいっぺん勉強しなおさなきゃ…

医療従事者の健康問題を扱った論文を探しているんですが、思ったほどエビデンスがないのがちょっと驚きです。今日はカテ室勤務者の被曝と健康問題についての論文を。Circulation-Cardiovascular interventions(2019IF5.5)掲載の2016年の論文。というか、循環器系ってIF5.5でもTop20に入らないのか…整形系だと同ランクでIF2.7くらいで、5.5だとAMERICAN JOURNAL OF SPORTS MEDICINEに次いで2位になります。


研究疑問 :①カテ室勤務者の健康問題の記述
 ②放射線被曝と健康問題の関連性の探索
研究デザイン :過去起点コホート(というより横断研究か)
セッティング :伊

P 心カテ学会参加者(2011, 2012)、循環電気生理学会参加者(2014)
+CNR Research Camous勤務者 
E 被曝機会あり 466人
C 被曝機会なし 280人
O 整形疾患、皮膚疾患、白内障、糖尿病、甲状腺疾患、
不安、高血圧、高コレステロール値症、脳卒中、心疾患、癌

カテーテル手技の従事者には重い防護具の使用、緊張、放射線被曝などによる健康問題が懸念されるが、どの程度発生しているのかはわかっていない、ので調べてみました!という研究。

【方法】
・対象者(全体で3200人)に任意で質問票への回答を依頼
 - 背景情報、勤務歴、生活歴、治療歴、健康状態などを調査
 - 953人(30%)から回答あり、うち207人は不十分で除外
 - 最終的な調査対象は746人(23%)
・被曝機会の程度は自作のORRSで数値化
 - 勤務年数×症例数(1-3の3カテゴリ)(×筆頭術者以外は0.5)
・解析は主に単変量解析
 - 年齢、性、喫煙習慣で調整したオッズ比も提示

【結果と結論】 
・被曝群は医師47%、看護師41%、技師12%
 - 勤務期間は中央値10年
・被曝群で多そうだった主な項目は
 - 皮膚疾患   9% vs 2% aOR 2.8 (1.3, 6.1) 
 - 整形疾患 30% vs 5% aOR 7.1 (4.0, 12.4)
 - 白内障   5% vs 1% aOR 6.3 (1.5, 27.6)
 - 高血圧症 13% vs 8% aOR 1.5 (0.9, 2.6)
 - 高コ血症 12% vs 4% aOR 3.1 (1.5, 6.2)
 - 癌   3% vs 1% aOR 3.0 (0.6, 13.7)
・健康問題の有病割合は、年齢と用量反応関係がありそう
・健康問題の有病割合はORRS≥13に多そう

で、だいたい被曝群のほうが健康問題が多かったので、カテ室の勤務安全性を高める必要があるでしょうとの結論。

【向学のためにlimitationのまとめ】
・回答割合30%は低いけど、こんなもの ←30%じゃなくて23%!
・直接線量を調べてないけど、線量計普及してないんだから仕方ない
・背景情報が偏っていたけど、貴重な情報でしょ?
・この研究は「One Million Workers Study」の先取り報告です。
 - 結果でるまえに、もっと被曝防護意識たかめましょう

【批判的吟味】★★★
興味深いアウトカムを複数調査しており、おもしろい研究でした。各アウトカムと放射線の関連性を示唆するメカニズム研究などをたくさん引用していて、非常に参考になります。「One Million Workers Study」どうなってるんだろ、次はここ調べて読んでみなきゃ。ただ、方法論的には回答割合23%
で、これだけ背景偏った集団で、ほぼ単変量解析に近い解析しても、バイアスが大きすぎて強いことはまず言えません。Limitationには述べてますが、全然defenseできてないし、これでIF5.5の雑誌に載るのは内容は切実だから?本研究結果はあくまで探索的な、仮説生成的な位置付けなので、各アウトカムについて質の高い追証が必要です。

【コメント】
2015年から現在までの5年間でこの分野のエビデンスはどれだけ蓄積されたのでしょうか?恐らくアカデミック力が高い循環器内科でこれなので、整形外科ではまだまだエビデンスは足りないに違いない!と信じて研究を進めようと思います。整形外科の先生方すいません…というか、なんか壮大な話になってきたな…そこまでの覚悟はなかったのですが…

最近なかなか勉強できていなかったので、そろそろSpineの最新論文を読んでみます。今後論文投稿の方針として、1-2回勝負して困ったらSpine!にしようと思っているので、マメにcheckしていかないと。現在自身の研究も含め3件予測モデル研究に関わらせていただいているので、今回は予測モデル研究です。JBJSにいくつか術後予測モデルが出ていますが、どういう切り口(新規性)なんでしょうか。

Development and Validation of CervicalPrediction Models for Patient-Reported Outcomesat 1 Year After Cervical Spine Surgery forRadiculopathy and Myelopathy

研究疑問  :頚椎術後1年の成績予測モデルを開発する
研究デザイン:多目的コホート(レジストリ)
セッティング:Quality Outcomes Database(cervical module)
*アメリカ28州71施設で構成(RedCap使用)
*2013.4月~2016.9月登録者のdataを使用

P1 手術をうけた頚髄症 4988人
P2 手術をうけた神経根症 2641人
E 各リスク因子あり
C 各リスク因子なし
O NDI、NRS頚部痛/上肢痛、mJOA低値(12M)
*4つのアウトカムについてそれぞれ解析

頚椎変性疾患に対する手術の有効性は確立されているが、Risk/Benefitのバランスには個人差が大きい。個人レベルの数値予測があると便利なので、予測システム作ってみました!という研究。

【方法】
・包含基準は頚椎変性疾患に対する全ての手術(再手術含む)
・除外基準は、感染、腫瘍、骨折、外傷、変形、麻痺の既往、18歳未満、収監?
・リスク因子は以下の3グループ
 ①背景因子
   年齢、性、BMI、人種、教育水準、喫煙、雇用有無、
   保険者、労災、DM、うつ、不安、罹患期間、しびれ、
   歩行能力
 ②各アウトカムのベースライン値
 ③ 臨床因子として
   術式、変性すべり、手術椎間数、麻痺
・各変数のオッズ比を関連性の強さとして算出
・モデルの性能はc統計量として報告
・欠測因子は多重代入法で補完
・ブートストラップサンプルに開発モデルを使って内的検証
・モデルはA①、B①+②、C①+②+③のパターン

【結果と結論】 
・12M時点でアウトカムに欠測なく解析されたのは7629例(61%)
・すべてのアウトカム低値に共通した強い予測因子は
 - 罹患期間、労災、年齢、雇用有無、歩行能力、喫煙
・③を追加しても予測性能はそんなに改善しなかった
 - 後方進入だけはアウトカム低値と関連
・全部で24のモデルの予測性能は0.65-0.73

というわけで、これらのモデルはshared decision-makingに利用できる可能性があるとの結論。ちなみに、文献内に予測モデルのWeb入力フォームのリンクが貼ってあり、数値を入力すれば12M時点での各アウトカム予測値が算出できる仕組み(モデルCを使用)。

ちなみにLimitationは
・Follow-up 割合61%は低い
 - けど変数欠測あり/なしで背景情報はあまりかわらない
・精神状況は重要だが、測定が甘い

【批判的吟味】★★★
何よりNが大きいので、変数選択せずに多変数が組み込めたのは非常に羨ましい限り。Web入力フォームを提供していて、実際の予測値を各臨床家が計算できるようにしているのも素敵です。これだけの多変数でスコアリングシステムだと絶対使えないでしょうから。実際に入力してみましたが、パパっと時間かからずに使えそう。Introが弱く新規性が伝わってこなかったので大丈夫かなと思いましたが、面白い研究でした。ただ、全体的に方法論としては以下粗いところが目立ちました。

・AbstractのMethodsが弱い(ので読んでも何したかわからない)
・アウトカム欠測何例、除外基準に抵触何例か知りたい
 - フローチャートが欲しい
・アウトカム測定方法の情報がない
・サンプルサイズ計算がない
・各変数の欠測数や、欠測有無別の背景情報が示されていない
・変数選択の根拠が薄い
 - 画像パラメータもいくつかは必要では(先行研究も多いので)
 - 例えば髄内輝度変化とか、後弯の程度とか…
 - 多分そのせいもあって性能が良くない
・性能検証が変(検証はできていない)
 - 開発モデルの、BSサンプルに対する性能評価は不適切
 - BSモデルの、開発サンプルに対する性能評価が必要 
 - せめてcloss validationかsplit validationができたはず
・臨床使用前に外的検証が必須であることはLimitationの最初に

【コメント】
じゃあ研究結果で臨床がかわるか?というと、ちょっとこの性能ではあまり役に立たないかも。数値予測なので性能が低いのは仕方ないし、既存の尺度がそもそも粗いのも現状どうしようもないです。でも、もっとしっかり変数測定と選択したりガチでデザインすればもう少しましなモデルが作れそう。「レジストリに登録してもらえるくら簡便な情報」じゃないと、そもそも臨床利用できない(使ってもらえない)ところがジレンマですが。いずれにしろ、このように多施設のレジストリで色々やっていこう!という流れはとても素晴らしいと思います。中国のマネー/人海戦術に対抗して、アカデミックの世界で日本が生き残るためには、負けないレジストリが必要だと切実に思ってきた今日この頃です。ちなみにこのモデル、2013のJBJSのモデルよりはずっといいっす…あと「労災」と「無職」に頚椎手術しても予後悪いのは強く共感…

11月は一大イベントがあり、とくに前半はかかりきりで論文を読んでいませんでした。その期間に相当たまってきたEAを渉猟してみます。と、先日塩漬けにしたと述べたテーマに近いシステマティック・レビュー(SR)がSpineに出ている…これがしっかりしたSRなら、別のテーマを探さなきゃ(いずれにしろするのは大分先ですけど)…ということでサラッと読んでみます。

Orthosis in Thoracolumbar Fractures: A Systematic Review and Meta-analysis of Randomized Controlled Trials

臨床疑問  :外傷性胸腰椎骨折に対するコルセットの効果は?
研究デザイン:Systematic Review
セッティング:全世界(~2019.6月)

P 急性期の外傷性胸腰椎骨折(合計267人)
I コルセット
C なし
O 後弯(6M/12M)、減高・VAS(6M)、入院期間
*Oに記載したのはメタアナリシス(MA)のみ記載
*Pubmed、Scopus、Cochrane Centralをkey word検索
*RCTのみを包含
*Risk of biasも評価
*PROSPEROに事前登録
*PRISMAに準拠

神経障害がない外傷性胸腰椎骨折にはコルセットが使われるが、そのRisk/Benefitはよくわかっていない。既存のSRは骨粗鬆症を対象にしたものや、2014年に2つのRCTを包含したものに限定されているので、改めてSRしてみました!という研究。結果は…

・重複を除いた1209研究が対象
 - Ti/Abスクリーニングで30研究
 - 本文checkで8研究(3つは学会報告)
 - 同一セッティングを除き最終的に5研究を包含
・後弯、減高、VASに差はなし
・1研究で12MのODI改善を報告(ただし24Mでは差なし)
・入院期間差はコルセット群が3日 (95%CI 1-6)むしろ長い

で、コルセットは保存的加療からの追加効果はない。この結果はガイドラインや政策に反映されるべきとの結論。

【批判的吟味】★★★
Spineでのエビデンスレベルは3と控えめですし、全体的に最低限のルールは守ってありキレイで読みやすい研究でした。これ以上改善する点もパッと思いつきませんが、気になる点を強いて挙げるなら

・検索式が物足りない(作り込んでも不変でしょうけど)
・全体的につかみや方法が浅い(深くやっても結果は不変でしょうけど)
・MAがMAX3研究267人で、「効果ない」とか結論づけるのは飛躍し過ぎ
 - 結論は「効果あるかどうかわからない」
・RoB評価が甘そう(細かなcheckはしてませんが)
・GRADE評価がない
・Benefitはわかったけど、Riskは?

そもそも外傷性の(骨粗鬆症じゃない)胸腰椎骨折でコルセットするかしないか迷う患者が対象なので、対象は結構限られるし、切実ネタか?というとちょっと微妙な気が。「成人」「急性期」「外傷性」「胸腰椎骨折」でくくってますが、T10 とL5では全然別の疾患ですし、骨密度や脊柱バランスなど非常に多様な領域。そもそもエビデンス不足が一目瞭然です。なので、できるできないは別としてやらなきゃいけないのはSRじゃなくて、質の高いRCTか悉皆レジストリ研究でしょう。

【コメント】
この完成度(決して低くはないです)なら、まだ「塩漬け研究」を復活させる余地はありそう。ただ、やらなきゃいけないのはSRじゃなくて、RCTか悉皆レジストリ研究なんですよね。自分にブーメランですが、色々な意味で敷居が高いなぁ…まずは実績と実力をつけるところから早急に…

先週は脳神経外科学会総会(岡山)に現地参加したりで、論文読むのをさぼってしまいました。さすがに1週間空いてしまったのでSpineの論文を読んでみます。

Preoperative Factors Predict Postoperative Trajectories of Pain and Disability Following Surgery for Degenerative Lumbar Spinal Stenosis

研究疑問  :LSS手術術後成績不良リスク因子は?
研究デザイン:過去起点コホート
セッティング:CSORNデータベース
*カナダ13病院で構成

P 50歳以上のLSS手術を受けた529人
E 各予測因子あり
C 各予測因子なし
O 下肢痛成績、総合成績(術後1年)

脊椎手術で最多なのはLSS手術だが、成績不良例が結構多い。術前に成績不良を予測する因子はよくわかっていないので調べてみました!という論文。

【方法】
術後成績は腰痛/下肢痛NRS・ODIを用いて測定
 - T
rajectory model?を用いexcellent、good、poorに3分
・予測因子候補は以下
 - 背景因子として年齢、性、BMI、労災
 - 健康関連因子としてSF-12、運動習慣
 - 臨床因子として治療歴、罹患期間、うつ、麻痺、ASA、並存症
 - 手術因子として待機期間、固定、MIST、手術時間、出血量、合併症
・NRSのMICDは30%
・ODIの治療成功は50%の改善もしくは22点以下の達成
・術前NRS<3、ODI≤20は解析から除外
・欠測は最尤推定法で補完
・モデルは術者を変量効果にした混合効果ロジスティックモデル
 - 全モデルは年齢、性、術前下肢痛・機能障害を固定変数?
 - (単変量解析の?)P≤0.1で変数選抜
 - Backward stepwise(P<0.05 )でさらに選抜
 - モデル性能はAUCで評価

【結果と結論】 
・下肢痛成績不良は36%、総合成績不良は28%
・下肢痛成績不良の予測因子は(調整オッズ比)
術前下肢痛 1.4 (1.2, 1.6)
労災 2.0 (1.1, 3.7)
SF-12MCS 1.3 (1.0, 1.8)
術前運動習慣 0.5 (0.3, 1.0)
・総合成績不良の予測因子は
術前機能障害 2.0 (1.5, 2.8)
待機期間 1.1 (1.0, 1.1)
罹患期間 3.2 (1.5, 6.5)
術前運動習慣 0.3 (0.2, 0.8)
術前カイロ 0.4 (0.2, 0.8)
労災 2.8 (1.1, 7.2)

というわけで、1/3の患者は成績不良でした...あと手術因子より背景因子、健康関連因子、臨床因子の方が予測には有用でしたよ、術前説明に役立ててね!との結論。

【批判的吟味】★★★
全体的に丁寧だし、代表性はさておき「3割が成績不良」という結果はインパクトがあります。でも致命的な欠陥がありますし、気になる点もチラホラあるのが非常に勿体ないです。大きな点だけまとめますと、

・術中因子や合併症をモデルに入れるのが完全アウト
 - 結果を術前説明に使うことは物理的に不可能
 - この1点で折角の丁寧な研究が台無しに…
・ここまでやったなら予測モデルにすべきでは
 - 臨床でどう使うかがよくわからない
・半数以上欠測している変数を補完するのは△
 - 欠測多≒臨床的重要性低、なので除外した方が…
・NRSとODIからアウトカムを3群に分類する方法が不明瞭
 - Trajectory modelって何?
 - 重要な情報なので「我々の先行研究参照」は不親切
・疾患重症度や画像パラメータが殆ど考慮されていない
・術前症状が軽い例を解析から除外するなら、研究から除外すべき

【コメント】
ぶっちゃけ脊椎領域ではかなり頑張っている研究で、今後も頑張って欲しい!と好感持てました。ただ方法論的に改善すべき点は少なくありません(上からですいません)。もっと発展しなければ!発展に貢献できるように日々修行しなければ!でも脊椎領域の論文以外は読む気がでない、脊椎領域に方法論的にお手本になる研究は激レアというジレンマ…あと労災はやっぱ手術したらイカンですね。

このページのトップヘ