二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ: ひとり抄読会

忙しさにかまけてなかなかEAをチェックできていなかったので、臨床の隙間時間を利用してみてみると…100文献以上たまっていました涙。殆どが私には直接関係ない整形絡みの論文ですが、なかに相当重要な論文を発見!「頚髄症手術は前から後ろからどっちの方がよい?」という、古来より結論が出ていない臨床疑問に対し、なんとJAMAにRCTが…これは読んでおかないと完全なモグリです。いったいどこの国から?とみてみるとやっぱりアメリカの多施設。さすが…

Effect of Ventral vs Dorsal Spinal Surgery on Patient-Reported Physical Functioning in Patients With Cervical Spondylotic Myelopathy: A Randomized Clinical Trial

研究疑問 :頚髄症(CSM)では前方>後方か?
研究デザイン :RCT
セッティング :北米15施設
*2014.4.1~2018.3.30

P 多椎間CSM(45~80歳)
I 前方除圧固定 63人
C 後方除圧もしくは除圧固定 100人
O 主要:SF-36(PCS, 1Y)
  副次:JOA, 合併症, 就業, SVA, Health resourceの使用?, NDI, EQ-5Dなど

CSMの手術は年々増えていて(2009年にnational health優先課題100に選抜)、米国では術後の頚部痛の少なさから前方除圧固定が良いとされる。でも結局前後どちらがよいかはっきりわかっていないので、調べてみました!という研究。

【方法】
・プロトコルと解析計画書を付録で添付
・CMSの定義は以下
 ①症状所見で以下2つ以上
  - 手の痺れ、歩行障害、深部腱反射亢進、バビンスキー陽性、膀胱障害、クローヌス
 ②2椎間以上の病変
・除外基準は以下
 - C2-7の後弯が5°以上
 - 前方骨棘が3椎間以上
 - 大きな骨棘やOPLL
 - 過去の頚椎手術既往
 - ASA4以上
・15人の専門家パネルが臨床的にequipoiseか(RCTして問題ないか)判定
 - 12人以上の合意
・5or10の置換ブロックで2:3に割付
・後方除圧の場合固定追加するかは術者の判断
・ランダム割付拒否/ランダム割付が不適格な患者もコホートとして追跡
・PCSは偏差値に変換
 - MCIDは5を採用
 - α0.05、パワー90%、脱落15%で必要サンプルサイズは159人
・中間解析は行わず、モニタリング委員が合併症を観察
・主解析(PCS)は線形混合モデル
 - 術者を変量効果、ベースラインPCS、介入、時点、介入×時点で構成
・他の解析も同様のモデル
 - 2値アウトカムはカイ二乗検定

【結果と結論】 
・潜在適格者458人中269人が参加、163人がランダム割付
・1年追跡は前方60/63人、後方95/100人で合計95%
 - 2年追跡は80%
・1年時のPCS改善は
 前方5.9 vs 後方6.2 で差0.3 (-2.6, 3.1)
・副次アウトカムの殆ど差なし、差があったのは以下(前方 vs 後方)
 - 合併症割合 48% vs 24%で差24% (8.7, 38.5)
 - 嚥下障害 41% vs 0%
 - 神経症状悪化 2% vs 9%
 - 再手術 6% vs 4%
 - 1ヶ月再入院 0% vs 7%
 
このように、別に前方が優れているという結果がでなかったとの結論。

<向学のためにlimitationのまとめ>
・椎弓形成をランダム割付できなかった
 - 椎弓形成をしているのは5/15施設しかなく米国では一般的ではないので
 - なので、事後解析のため後方群を多めにした
・Nが少ないのでサブグループ解析は微妙
・後方術式選択にバイアスが入っているかも
 - 除圧のみと除圧固定の適応は今後の課題

【批判的吟味】★★★★★
めちゃくちゃ頑張らないシンプルなデザインでも、ネタが重要で丁寧にやればJAMAに載るという夢のある論文。まぁ「優先課題100」だったり、JAMAのお国元である北米の研究ってのも大きいでしょうけど。前方か後方かサイコロ振って決めさせろ!というのもよほど有名な病院じゃないと患者逃げちゃいますから、民間病院ではできないですが涙。RoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 Low risk
3. アウトカムの追跡 Low risk
4. 評価者の盲検化 Some concerns
5. 選択的な報告 Low risk

RCTの質としてはかなり高いかなと(じゃないと今の時代JAMAには載りません)。欠測は約5%と少ないし、術式のクロスオーバーもかなり少ない。自己申告だし、PCSだとちょっと緩い気はしますが他にないんだから仕方ない。Flow chartの始まりが包含基準満たした対象じゃなく、その前の「Patients screened」になっているのもTop journalならでは。スタートの458人から、参加拒否とかランダム割付拒否で落ちたのが26人しかいないって俄かには信じがたいですが…そんだけ強い施設の研究なんでしょう。羨ましい限り…

【コメント】
というか、メジャー施設15のうちLaminoplastyしてるの1/3しかないとかアメリカどうなってんだ!?頚髄症で固定要る人そんなに多いとはとても思えない…どうやら北米は頚髄症後進国なので、カッチリした頚椎の研究は日本発で発信する余地が大分ありそう。だから頚椎後方はアジア発の論文が多いのか…日本での臨床経験しかない田舎者なので、なかなかピンときませんが。これは探せばネタはいくらでもありますね…時間がないけど涙

近年レセプトデータなどの、いわゆるビッグデータを用いた研究が増えてきています。ビッグデータは各データは浅い(粗い)ものの、悉皆性の高さ全体としてのデータ量が大きいことから、これまでの施設ベースの研究とは異なった切り口のエビデンスを創出することが期待されます。脊椎関連では国家規模のレジストリであるSwespineや、アメリカの公的医療保険データであるMedicareを使った研究をみかけますが、今回は後者を用いたビッグデータコホート研究の例として、CORR(2019IF4.3;整形外科5位)の論文を読んでみます。

What Is the Value of Undergoing Surgery for Spinal Metastases at Dedicated Cancer Centers?


研究疑問 :特定がんセンターでの脊椎メタ手術の費用対効果は?
研究デザイン :データベース研究
セッティング :Medicare(原則アメリカの65歳以上全員が加入)
*2005~2014のdataを使用

P 脊椎メタで手術を受けた患者(椎体形成のみは除く)
E 特定がんセンターで手術
C 特定がんセンター以外で手術
O 合併症/コスト(術後90日)

特定がんセンターでは、Medicareでも例外的に包括支払いではなく出来高払いが行われる。担癌患者の寿命伸延に伴い脊椎メタおよびその手術が増加し、効果は報告されている。しかしがんセンターが費用に見合う効果を提供しているかは不明である。そこで調べてみました!という研究。

【方法】
・ICD-9コードで「除圧術」「固定術」「脊椎メタ」を同定
・「がんセンターかどうか」も同定
・ほか背景因子として以下を同定
 - 年齢、性、地方、低所得地域かどうか、原発巣、合併症
・施設因子として以下を同定
 - 都心か、病床数、がん認定病院か、脊椎メタ手術数、公私
・手術因子として以下を同定
 - 術式、手術椎間数、術前放射線/化学療法
・合併症の定義は以下
 - 創部、循環、塞栓、敗血症、肺炎、尿路感染、腎、救急受診、
   インプラント問題、再手術、再入院、死亡
・コストは手術日から術後90日までを集計
・1138/17776(6%)が特定がんセンターの手術だった
・解析はまず検定
・合併症の発生割合差は混合効果ロジスティック回帰
 - コストの差はγ分布/対数リンク?の混合効果モデル
 - いずれも施設因子で層化し、背景因子と手術因子で調整

【主な結果と結論】 
特定がんセンター vs 非特定がんセンターで差がついたのは以下
 敗血症 7% vs 10% aOR 0.54 (0.40, 0.74)
 尿路感染 19% vs 28% aOR 0.61 (0.50, 0.74)
 腎障害 9% vs 13% aOR 0.55 (0.42, 0.72)
 救急受診 27% vs 31% aOR 0.78 (0.64, 0.93)
 死亡 39% vs 49% aOR 0.75 (0.63, 0.89)
 コスト差 -14802$ [SE 1362]; p<0.001  

との結果で、特定がんセンターは質が高く低コストな医療を提供しており、その仕組みを他の病院も学ぶべきでしょうとの結論。

<Limitationのまとめ>
・著者全員が特定がんセンター所属だった
 - でもちゃんと報告してますし、data自体は客観的です
・細かな術式の情報がない
 ‐ 固定のみが想定外に多かったのも変
・若年層が入っていないので一般化に限界
 - でも特定がんセンターの例外的包括支払はMedicare受給者に限定
 - 特定がんセンターの価値をみる研究としては妥当な対象
・施設因子に総スタッフ数、看護師比率、レジストリへの参加がない
 - でも経時変化する変数だから捕まえれない
・術者の経験や技量のデータもない
・施設による手術テクノロジーのデータもない
・がんの状態のデータもない

【批判的吟味】★★★★
「施設効果」という介入の効果をみる研究なので理論的にはRCTがbestですが、施設へのランダム割付とか無理だし、盲検化もできないので実質データベース研究一択です。データベースはテーマに沿っているし、悉皆性も高いので相当いい研究!どうしても各変数は浅くなってしまい、(limitationにかなり厚く書かれていますが)原疾患や脊椎病巣の病状、術者の経験と技量、術式など最も重要な因子が未測定/残余交絡となって大きく比較の質を損ねてはいます。が、有意にならなかったアウトカムも含め、軒並み特定がんセンター>非特定がんセンターだったことからも、結果は頑健かと。小規模だけど深い研究と比べると、対象の代表性や純粋な検出力に大きな優位性があります。

【コメント】
研究テーマによっては相当有効なデータベース研究、データベースへのアクセスやデータソース突合の敷居が下がって、日本でももっと色々できるようになれば素晴らしいです。研究デザイン力や解析の引き出しを増やして、未来にそなえなきゃ…

先日介入の効果をみる前向きコホート研究(非RCT)を読みましたが、引き続きお手本となるコホート研究を読んでみます。ある特徴が将来のアウトカムと関連するか?という予後をみる研究については、前向きコホート研究が最強になります。まぜなら「ある特徴」は介入と違ってランダム割付することができず、RCTが不可能だからです。それこそ研究デザイン力が結果の精度に大きく影響する臨床疑問になります。やぱりお手本なんで、JAMA様から…

Long-term risk of incident vertebral fractures


研究疑問 :低骨密度(BMD)は将来の骨折と関連するか?
研究デザイン :前向きコホート
セッティング :Study of Osteoporotic Fractures(SOF)
*1986年に開始、米4施設で構成

P 高齢白人女性(平均年齢69歳)
E   既存骨折あり
C 既存骨折なし
O 新規骨折

P 高齢白人女性(平均年齢69歳)
E   低BMD(単位は1SD)
C BMD正常
O 新規骨折

以前に低BMDと椎体骨折の関連、および既存椎体骨折と続発椎体骨折との関連について報告したが、平均3.7年のfollowと短かった。ので、15年以上観察した報告をまとめてみますとの研究。

【方法】
・細かな研究計画は先行研究参照
 - 黒人女性はリスクが低いので含んでいない
・研究参加9704人
 - 第8回調査対象は4284人(44%)
 - 実際に受診したのは2797人(29%)
 - うちX線が撮れて、読めて、ベースラインX線もある2680人(28%)を解析
・X線ではT4-L4の前方・中央・後方椎体高を測定
 - まず盲検化された3人でスクリーニング
 - 各X線で一番変形が強そうな椎体を、正常/微妙/たぶん骨折に評価
 - たぶん骨折だけ細かく測定
 - ランダムサンプル503人で試し測定
 -感度は「既存骨折」「新規骨折」それぞれ97%, 100%
・「既往骨折」の判定には前方/後方、中央/後方、後方/尾側椎体の後方を使用
 - いずれかが3SD未満の場合に「既存骨折」
・「新規骨折」の判定には前方、中央、後方を使用
 - いずれかが20%もしくは4mm減高で「新規骨折」
・BMDは踵骨、橈骨、大腿骨、大腿骨頸部、腰椎で測定

<解析>
・まず本研究対象2680人と非対称7024の背景を比較
・骨折時期はわからないので(Coxではなく)ロジスティック回帰
 - まず年齢と施設で調整
 - 続いてさらに骨粗鬆症加療、非脊椎骨折既往、BMI、喫煙習慣で調整
・ 年齢/施設モデルでROC解析(各BMD部位で)
 - さらに70歳以上/既存骨折で層化した解析も
・BMDと既存骨折で絶対リスクを算出

【主な結果と結論】 
・487(18.2%)に新規椎体骨折が発生
 - 既存骨折ありは163/394(41.4%)、なしは324/2286(14.2%)
 - 既存骨折のオッズ比は4.21 (3.33, 5.34)
・低BMD(1SD単位)も新規骨折の発生と関連
 - (大腿骨で)オッズ比 1.78 (1.58, 2.00)
・大腿骨BMD‐2.5SD未満+既存骨折ありの新規骨折発生は56%
 - 一方BMD正常で既存骨折は9%

既存骨折ありと低BMDはいずれも独立した新規骨折のリスク因子であり、既存骨折があり更に低BMDなら注意!との結論。

<Strength / limitationのまとめ>
・地域住民を対象とし、サンプルサイズが多く、15年目のX線を用いている。
・高齢白人女性以外(他の人種や男性)に結果が当てはまるかは不明
・生存者の多くが再診したが、再診しなかった人よりベースラインが健康だった
 - ので、骨折リスクを過小評価している
・腰椎と大腿骨のBMDはベースラインの2年後に測定
 - でもベースラインで測定した踵骨や橈骨とかわらない結果

【批判的吟味】★★★★★
アメリカやっぱ規模がすごいです。この研究幾らかかってるんだろ…ここまでやれば観察研究でもJAMAに載るんですね。解析は(私でもわかるような)シンプルなものですが、当時は旧き良き時代だったから?ツッコむところがあるとすれば、観察研究なんで交絡の調整は十分か?というところ。パーキンソン病、ステロイドはじめとした二次性骨粗鬆症…骨折と関連する疾患は相当たくさんあります。ただ、だからといってこの研究の結果が覆るとは思えませんし、結果に異論を唱える人はいないでしょう。ちなみにこれを「高齢日本人」で調べるのも重要かも(日本人だけ対象でJAMAに載るかはわかりませんが…)。

【コメント】
PubMedでSOFをひくと約30の文献が…やっぱり大きなコホート研究は枝論文が結構でますね。かく言う私も福島医大/京大のコホート研究の脛をかじりまくらせていただいています。「予後をみる研究」はRCTできない分、コホート研究頑張れば最善のエビデンスが出せますので、それこそ脊椎絡みの多目的コホート研究、多施設でできないかなぁ…「介入の効果をみる研究」のための疾患特異的レジストリも必要ですけど。

本日は私の人生の転帰ともなった臨床研究デザイン塾でした。コロナ渦の影響でWeb開催になったのですが、これはこれでコンパクトにまとまっていい会だなぁと改めて刺激をいただきました。私の班の皆さんもそうだったのですが、やはり臨床医が一番調べたいのは「介入の効果」だなと再認識。理想としてはRCTでしょうが、費用面ほか高根の花、というか非現実的。じゃあどうしよう?というのが切実な問題です。RCT頑張っても選択バイアスは問題ですし。個人的には前向きコホートしかないんじゃないかな?と思っています。ので、今回はお手本として「介入の効果をみる前向きコホート」を読んでみます。JAMA様なら間違いないでしょう!

Surgical vs nonoperative treatment for lumbar disk herniation: the Spine Patient Outcomes Research Trial (SPORT) observational cohort


研究疑問 :腰椎椎間板ヘルニア(LDH)に手術は有効か?
研究デザイン :前向きコホート
セッティング :Spine Patient Outcomes Research Trial(SPORT)
*RCTとRCT拒否者で構成された前向きコホートで構成
*米11州13施設

P LDHによる根症状(6W以上)がある患者
I 手術
C 保存(指導、PT、NSAIDsなど)
O 主要:SF-36(BP/PF)、ODI(3M, 6M, 1Y, 2Y)
  副次:治療成功感、就業、満足感、坐骨神経痛

SPORT(RCT)におけるITT解析では手術と保存に差が出なかった。でもRCTは一般化に問題があるし、介入が定期手術なのでクロスオーバー(手術群⇄保存群)がITT解析の結果を歪める。ので、SPORTでは前向きコホート研究もするんですよ!という研究。

【方法】
・細かな研究計画はプロトコル論文参照
・看護師が適格者を抽出し、RCTか観察研究への参加を提案
 - 観察研究を選んだ患者は医師を受診
 - 手術かそのまま保存かを自己選択
・手術はopen diskectomy
・坐骨神経痛の程度はSciatica Bothersomeness Indexで測定
・アウトカムはベースラインからの変化と改善者の割合として比較
 - 保存群は割付時をベースライン、手術群は手術直前をベースライン?
 - 測定日がズレた場合は、線形補完した平均値を使用
・解析モデルには欠測とアウトカムに関連する変数を投入
 - 複数測定の影響に変量効果モデルを使用

【結果と結論】 
・潜在適格者1991人中1244人がSPORTに参加
 - 743人が前向きコホートに参加(手術希望521人/保存希望222人)
・参加者の97%が1回は測定でき、解析に組み入れ
 ‐ 各測定時点での測定割合は82‐89%
・手術⇄保存のクロスオーバーで結局手術528人/保存191人
・保存治療の内訳以下
 - 指導92%、NSAIDs58%、麻薬系35%、PT43%、ブロック38%
・手術合併症は以下
 - 輸血2人、硬膜損傷2%、再手術1年7%2年9%(半分が再発で)
・主な効果は以下(手術 vs 保存)
 BP変化量 (3M) 40.9 vs 26.0 差14.8 (10.8, 18.9)
 PF変化量 (3M) 40.7 vs 25.3 差15.4 (11.6, 19.2)
 ODI変化量(3M) -36.1 vs -20.9 差 -15.2 (-18.5, -11.8)
 BP変化量 (2Y) 42.6 vs 32.4 差10.2 (5.9, 14.5)
 PF変化量 (2Y) 43.9 vs 31.9 差12.0 (7.9, 16.1)
 ODI変化量(2Y) -37.6 vs -24.2 差 -13.4 (-17.0, -9.7)

このように、手術群の方が改善がよかった!が、自己申告のアウトカムなので解釈は慎重に行うべきであるとの結論。

<向学のためにlimitationのまとめ>
・適格基準が厳しいので、結局一般化に支障
 - 6W我慢できなかった人が含まれていない
 - でもガイドラインでは6W待つわけだから影響は小さいでしょ
・保存的加療は多様すぎる
 - 一部無効だったり有害だった場合に手術の効果を誇張
 - でもだいたいどの治療も効果あるとされている
・欠測が14~18%あった
 - でも複数の感度解析で結果が覆らないことが示された
・盲検化されていないうえに、アウトカムが自己申告
 - 後療法への意欲、期待、変化への気づきなどが結果を修飾
・すべての患者や術者の要因を考慮することは不可能
 - 未測定交絡がどの程度結果に影響しているかは不明

【批判的吟味】★★★★★
どこかでSPORTの枝研究読んで、もう一つだな…と思っていたのですが、本家はすごかったです。もう15年前にこんなに丁寧な研究がされていたんですね、そりゃJAMAに載るのも納得。RCTと対じゃなく、この研究1本だけなら無理だったでしょうけど。思いつくLimitationは全部書かれていたし、突っ込み思いつきません。お手本にするには交絡や欠測の取り扱いの詳細がなかったのが物足りなかったのは残念ですが、プロトコル論文には書いてるのかな。てかプロトコル論文がSpineに載るってすごい…

【コメント】
PubMedでSPORTをひくと100以上の文献が…これだけ大きな研究に関われたら臨床家/研究者として一生の仕事になりますね。それにしても「非盲検化」「アウトカム自己申告」は相当手ごわい問題…結局1/3が研究参加自体を拒否しているので、選択バイアスも結構ありそうだし。でもこれ以上どうしたらいいんでしょうか…バイアスも含めて治療効果!患者良くなってたらそれでいいじゃん!という考えもあるでしょう。でももし結果がバイアスからきてるなら、手術してなくても良くなってたじゃん!ということになるんですよね。手術の純粋な効果をみるのはホントに難しい…(てかシャム手術しないと無理?)

Penalised regressionについて少し学んだところで、実例をみてみることに。変数選抜までしようと思ったらlassoになるようなのですが、lassoのお手本論文はないかな~と最近全然論文読んでいないので、Core clinical journalで「lasso」を探してみます。するとJBJSに面白そうな論文が。方法論的にお手本になるかどうかはちと不安ですが、折角なので読んでみます。

Predicting Occurrence of Spine Surgery Complications Using "Big Data" Modeling of an Administrative Claims Database

研究疑問 :脊椎手術合併症予測モデルの開発と検証
研究デザイン :データベース研究
セッティング :2006~2020の米レセプトデータベース

P 脊椎手術患者
E 各リスク因子あり
C 各リスク因子なし
O 主要:何らかの合併症
  副次:合併症数、入院期間、入院費、再入院、再手術

脊椎手術後の合併症を予測する予測モデルはなかったので、大規模データベースを使って開発と検証を行ってみました!という研究。

【方法】
・脊椎手術病名がついた患者を特定
 - 変性疾患、外傷、腫瘍、感染に分類
 - 並存症の病名とも収集
 - 術後1ヶ月以内の各種新規病名を合併症と定義
・予測因子を入院、外来、調剤、医師/病院への支払いレセプトから収集
 - 術前診断、11並存症、頚椎/胸腰椎、前方/後方、癒合、
   インスツルメント、多椎間、BMP
・まず開発コホート(80%)で主要アウトカムの予測モデル作成
 - 通常のロジスティック回帰にすべての因子を投入?
 - 術式で層化した予測モデルも作成
・残り20%で検証
・交互作用項を含めたモデルでlasso回帰も施行
・CARTとboostingによるモデル開発も施行 ←なにこれ…

【結果と結論】 *結果みたいわけじゃないので簡単に
・対象は約28万人
・合併症は14.0%で、先行研究と矛盾なし
・標準、lasso、CART、boostingではCARTの性能が劣った
 - boostingは標準回帰とほぼ同じ結果
 - なので標準回帰とlassoに注目
・でもだいたいAUC0.70前後で大差なし
 - Charlsonの予測能0.61より優れていた

などなどで、術前説明に役立つでしょ?という結論。

【批判的吟味】★★★★
サンプルサイズが莫大だし、イベントも14%あれば統計学的にはやりたい放題の羨ましい研究。ただ、いわゆるBig Smallデータ(浅くて多いデータ)で予測モデル作っても、臨床にどう役立てていいかピンときません。対象の選定も、リスク因子やアウトカムすべてがレセプト上のコードで定義されていますので、臨床使用するには粗すぎて…性能も妥当性検証までして信頼できそうなのは素晴らしいですが、AUC0.7で臨床意思決定に使うのは微妙です。あと、モデル作ったのはいいけど、どう臨床で使うかの説明がない!のでそもそも使い様がない…一応Nの暴力で★4つにはしますが。

というか、みたかったlassoの結果がAppendixになっていて、Ovidでのアクセスではみれず涙。結局細かなところがさっぱりわからなかったのは最大の誤算でした…

【コメント】
Lasso regressionについては3000件ほど既に既報があるようです。数割を占めるMe〇icineの文献はスルーするとして、いわゆるNEJM、Lancet、JAMA、BMJは全然hitしないということは、まだそこまで受け入れられている方法論ではない?というより小細工しなきゃな小規模研究はそもそも選外なのかな。悲しいかなJBJSは肩透かしだったので、次はJAMA₋IMなどをお手本に読んでみることにします。Lassoの勉強に一日使ってしまった…一応STATAで数字出せるようにはなったけど、時間が足りねぇ…

このページのトップヘ