二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ:ひとり抄読会 > ★★★★論文

近年レセプトデータなどの、いわゆるビッグデータを用いた研究が増えてきています。ビッグデータは各データは浅い(粗い)ものの、悉皆性の高さ全体としてのデータ量が大きいことから、これまでの施設ベースの研究とは異なった切り口のエビデンスを創出することが期待されます。脊椎関連では国家規模のレジストリであるSwespineや、アメリカの公的医療保険データであるMedicareを使った研究をみかけますが、今回は後者を用いたビッグデータコホート研究の例として、CORR(2019IF4.3;整形外科5位)の論文を読んでみます。

What Is the Value of Undergoing Surgery for Spinal Metastases at Dedicated Cancer Centers?


研究疑問 :特定がんセンターでの脊椎メタ手術の費用対効果は?
研究デザイン :データベース研究
セッティング :Medicare(原則アメリカの65歳以上全員が加入)
*2005~2014のdataを使用

P 脊椎メタで手術を受けた患者(椎体形成のみは除く)
E 特定がんセンターで手術
C 特定がんセンター以外で手術
O 合併症/コスト(術後90日)

特定がんセンターでは、Medicareでも例外的に包括支払いではなく出来高払いが行われる。担癌患者の寿命伸延に伴い脊椎メタおよびその手術が増加し、効果は報告されている。しかしがんセンターが費用に見合う効果を提供しているかは不明である。そこで調べてみました!という研究。

【方法】
・ICD-9コードで「除圧術」「固定術」「脊椎メタ」を同定
・「がんセンターかどうか」も同定
・ほか背景因子として以下を同定
 - 年齢、性、地方、低所得地域かどうか、原発巣、合併症
・施設因子として以下を同定
 - 都心か、病床数、がん認定病院か、脊椎メタ手術数、公私
・手術因子として以下を同定
 - 術式、手術椎間数、術前放射線/化学療法
・合併症の定義は以下
 - 創部、循環、塞栓、敗血症、肺炎、尿路感染、腎、救急受診、
   インプラント問題、再手術、再入院、死亡
・コストは手術日から術後90日までを集計
・1138/17776(6%)が特定がんセンターの手術だった
・解析はまず検定
・合併症の発生割合差は混合効果ロジスティック回帰
 - コストの差はγ分布/対数リンク?の混合効果モデル
 - いずれも施設因子で層化し、背景因子と手術因子で調整

【主な結果と結論】 
特定がんセンター vs 非特定がんセンターで差がついたのは以下
 敗血症 7% vs 10% aOR 0.54 (0.40, 0.74)
 尿路感染 19% vs 28% aOR 0.61 (0.50, 0.74)
 腎障害 9% vs 13% aOR 0.55 (0.42, 0.72)
 救急受診 27% vs 31% aOR 0.78 (0.64, 0.93)
 死亡 39% vs 49% aOR 0.75 (0.63, 0.89)
 コスト差 -14802$ [SE 1362]; p<0.001  

との結果で、特定がんセンターは質が高く低コストな医療を提供しており、その仕組みを他の病院も学ぶべきでしょうとの結論。

<Limitationのまとめ>
・著者全員が特定がんセンター所属だった
 - でもちゃんと報告してますし、data自体は客観的です
・細かな術式の情報がない
 ‐ 固定のみが想定外に多かったのも変
・若年層が入っていないので一般化に限界
 - でも特定がんセンターの例外的包括支払はMedicare受給者に限定
 - 特定がんセンターの価値をみる研究としては妥当な対象
・施設因子に総スタッフ数、看護師比率、レジストリへの参加がない
 - でも経時変化する変数だから捕まえれない
・術者の経験や技量のデータもない
・施設による手術テクノロジーのデータもない
・がんの状態のデータもない

【批判的吟味】★★★★
「施設効果」という介入の効果をみる研究なので理論的にはRCTがbestですが、施設へのランダム割付とか無理だし、盲検化もできないので実質データベース研究一択です。データベースはテーマに沿っているし、悉皆性も高いので相当いい研究!どうしても各変数は浅くなってしまい、(limitationにかなり厚く書かれていますが)原疾患や脊椎病巣の病状、術者の経験と技量、術式など最も重要な因子が未測定/残余交絡となって大きく比較の質を損ねてはいます。が、有意にならなかったアウトカムも含め、軒並み特定がんセンター>非特定がんセンターだったことからも、結果は頑健かと。小規模だけど深い研究と比べると、対象の代表性や純粋な検出力に大きな優位性があります。

【コメント】
研究テーマによっては相当有効なデータベース研究、データベースへのアクセスやデータソース突合の敷居が下がって、日本でももっと色々できるようになれば素晴らしいです。研究デザイン力や解析の引き出しを増やして、未来にそなえなきゃ…

Penalised regressionについて少し学んだところで、実例をみてみることに。変数選抜までしようと思ったらlassoになるようなのですが、lassoのお手本論文はないかな~と最近全然論文読んでいないので、Core clinical journalで「lasso」を探してみます。するとJBJSに面白そうな論文が。方法論的にお手本になるかどうかはちと不安ですが、折角なので読んでみます。

Predicting Occurrence of Spine Surgery Complications Using "Big Data" Modeling of an Administrative Claims Database

研究疑問 :脊椎手術合併症予測モデルの開発と検証
研究デザイン :データベース研究
セッティング :2006~2020の米レセプトデータベース

P 脊椎手術患者
E 各リスク因子あり
C 各リスク因子なし
O 主要:何らかの合併症
  副次:合併症数、入院期間、入院費、再入院、再手術

脊椎手術後の合併症を予測する予測モデルはなかったので、大規模データベースを使って開発と検証を行ってみました!という研究。

【方法】
・脊椎手術病名がついた患者を特定
 - 変性疾患、外傷、腫瘍、感染に分類
 - 並存症の病名とも収集
 - 術後1ヶ月以内の各種新規病名を合併症と定義
・予測因子を入院、外来、調剤、医師/病院への支払いレセプトから収集
 - 術前診断、11並存症、頚椎/胸腰椎、前方/後方、癒合、
   インスツルメント、多椎間、BMP
・まず開発コホート(80%)で主要アウトカムの予測モデル作成
 - 通常のロジスティック回帰にすべての因子を投入?
 - 術式で層化した予測モデルも作成
・残り20%で検証
・交互作用項を含めたモデルでlasso回帰も施行
・CARTとboostingによるモデル開発も施行 ←なにこれ…

【結果と結論】 *結果みたいわけじゃないので簡単に
・対象は約28万人
・合併症は14.0%で、先行研究と矛盾なし
・標準、lasso、CART、boostingではCARTの性能が劣った
 - boostingは標準回帰とほぼ同じ結果
 - なので標準回帰とlassoに注目
・でもだいたいAUC0.70前後で大差なし
 - Charlsonの予測能0.61より優れていた

などなどで、術前説明に役立つでしょ?という結論。

【批判的吟味】★★★★
サンプルサイズが莫大だし、イベントも14%あれば統計学的にはやりたい放題の羨ましい研究。ただ、いわゆるBig Smallデータ(浅くて多いデータ)で予測モデル作っても、臨床にどう役立てていいかピンときません。対象の選定も、リスク因子やアウトカムすべてがレセプト上のコードで定義されていますので、臨床使用するには粗すぎて…性能も妥当性検証までして信頼できそうなのは素晴らしいですが、AUC0.7で臨床意思決定に使うのは微妙です。あと、モデル作ったのはいいけど、どう臨床で使うかの説明がない!のでそもそも使い様がない…一応Nの暴力で★4つにはしますが。

というか、みたかったlassoの結果がAppendixになっていて、Ovidでのアクセスではみれず涙。結局細かなところがさっぱりわからなかったのは最大の誤算でした…

【コメント】
Lasso regressionについては3000件ほど既に既報があるようです。数割を占めるMe〇icineの文献はスルーするとして、いわゆるNEJM、Lancet、JAMA、BMJは全然hitしないということは、まだそこまで受け入れられている方法論ではない?というより小細工しなきゃな小規模研究はそもそも選外なのかな。悲しいかなJBJSは肩透かしだったので、次はJAMA₋IMなどをお手本に読んでみることにします。Lassoの勉強に一日使ってしまった…一応STATAで数字出せるようにはなったけど、時間が足りねぇ…

そろそろ大きなプロジェクトが本格始動しそうなので、その前にできるだけ論文書いておかないと!と最近必死です。全然結果でてませんが(涙)。やっと5本目できたので、6本目のためにまず勉強。整形(脊椎)外科医なら誰でもちょっとは気になったことがあるであろう「爪の黒い線(LM)」についてのKey paperを読んでみます。皮膚科のtop journalであるJ AM ACAD DERMATOL (2019IF8.3)に2019年掲載。


研究疑問  :LMがSubungual melanoma(SUM)か良性かを見分ける
研究デザイン:過去起点コホート
セッティング:Weill Cornell Medicine(ニューヨークの単施設)
*2011年1月~2017年11月

P 生検を受けたLM84人
E 各リスク因子あり
C 各リスク因子なし
O SUM

【まずはじめに】
・LMの鑑別診断は血腫、真菌/細菌、メラノサイト過形成、母斑、SUM
・SUMは爪床にできる珍しい悪性黒色腫
 - 悪性黒色腫の0.7%~3.5%
 - 診断が遅れがちで5年生存率30%、診断時の深達度は3.5~4.7mm
・SUMの確定診断は生検だが、臨床診断にABCDE ruleがある.
 A: Age, African Americans, Asians, native Americans 
 B: Breadth (3mm~), Brown-to-black coloration,  variegated Borders
 C: Change
 D: Digit (tumb >hallux >index >single >multiple)
 E: Extension (Hutchinson sign)
 F: Family history
・ほか色素が不均一、三角形、爪割れなどに注意
・近年はdermoscopyも有用

SUMは早期診断できるかが命運を分けるので、臨床診断とdermoscopyで良性のLMとSUMを分別できるか、ABCDEFが妥当か自験例を見直してみました!という研究。 

【方法】
・電子カルテから背景情報を抽出
・各変数に群間差があるか検定
・続いて全症例をABCDEF改で判定
 - 各項目に+/-をつけてやっぱり検定

【結果と結論】 
・P値が有意になった(SUMとの関連が示唆された)項目は
 - 若い、LMがみつかってから長い、LMが広い
・ABCDEF改もDermoscopyも全然当てにならない
・臨床的なSUM鑑別は難しくい
 - 幅が爪の40%以上のLMに生検するのはどう?

【考察のサマリー】
・若いから大丈夫というのは嘘
・LMでて10年以上+SUMだった人は、みなLMが拡大
・爪の幅は多様なので「幅3mm」より「LMの占める割合」がいい
 - 40%をカットオフにしたら有意になった
・DermoscopyがきれいなSUMが2人いた

【批判的吟味】★★★★
解析については随分脆弱でしたが、アウトカム8人だとできることには限界あり。SUMだったLMの写真と、それっぽいけど良性だったLMの写真がたくさん掲載されていたり、珍しいSUMのn=8のケースシリーズ+αとして臨床的に意義が高い研究です。個人的にはぐちゃぐちゃ謎の解析するより、こういうケースシリーズの方がずっといいと思っているのですが、そういう研究がTop journalに載るのは何か嬉しい。頑張って検索かけてもLMの先行研究全然でてこないので、文献リスト孫びきしたかったのですが、そこが思ったほど充実していなかったのは残念でした。

【コメント】
結局LMは悪いんか?については情報は得られず(=悪くない、んでしょうね)。罹患期間が長いと悪いかも?というメッセージはちょっと怖かったですが。LMの中にはヤバいやつ(SUM)があるのはわかりましたが、その有病割合などもわかりません。これはエビデンス集めるの大変そう…Systematic Reviewするわけではありませんが、漏れのないよう地道に腐らずやっていくしかありません。非英語文献まではいいですよね…

EAをcheckしていると、トップジャーナルであるAIM(2019IF21.3)から坐骨神経痛に対する保存療法(早期理学療法:EPT)のRCTが。臨床的にも方法論的にも勉強になりそうなので読んでみます。AIMに載ったRCTで星5/7ってのはどういうことでしょうか。

Physical Therapy Referral From Primary Care for Acute Back Pain With Sciatica : A Randomized Controlled Trial

研究疑問  :急性期の坐骨神経痛にEPTは有効か?
研究デザイン:RCT
セッティング:米2施設(2015.3月~2018.10月)

P 発症3M以内の坐骨神経痛220人
I  EPT
C 標準治療
O 主要:ODI(6M時点での変化量)
副次:疼痛、治療成功、ヘルスケアの利用、休職

プライマリケア領域の愁訴で腰痛は2番目に多く、その3割に坐骨神経痛を伴う。急性期の坐骨神経痛に対する保存治療に関するエビデンスは少なく、とくにEPTの効果についてはエビデンスが足りないのでRCTしてみました!という研究。

【方法の主なところ】
・受診6M以内に治療歴がない坐骨神経痛患者を特定
 - 手紙を送り、次に電話で参加意思を確認
・ほか包含基準は20<ODI、
・除外基準は1年以内の脊椎手術、妊娠、馬尾症状、麻痺
・変動ブロック法で1:1の中央割付
・両群ともに1回の教育セッション
 - その後4WのEPT(無料)と追加治療なしに割付
・ EPTは研究用のトレーニングを受けた認定PTが施術
 - 運動と施術で痛みを中心化し、消失させる
 - 2回/W×2+1回/W×2+αで合計6-8回/4W
・ODIのMICD7・SD16でサンプルサイズ計算
・解析には混合効果共分散モデルを使用
 - 各アウトカムのベースライン値を調整
 - 解析対象はITT集団?

【結果と結論】
・6M時点での追跡割合はI群87%とC群91%
・4Wの時点でプロトコル外イベントがI群39%とC群47%に発生
 - 脊椎外科受診(I群10% C群8%)や手術
 - I群の10%はEPT受けず
 - I群の3%、C群の13%が病院外の他の治療へ
・6M時点でのODI改善差は-5.4 (-9.4, -1.3)
・治療成功はI群 45% vs C群 28%
 - 相対リスク 1.6 (1.1, 2.4)
・ヘルスケア利用と休職に有意差はつかず

というわけで急性期の坐骨神経痛(麻痺なし)にEPTは効果ありますよ!との結論。

<ちなみにlimitation>
・介入時間を考慮していなかった?
・EPTのどの部分に効果があったかはわからない
・教育セッションも日常診療で行わない
 - のでC群が日常診療を反映するともいえない
・患者もPTも盲検化できていない
・白人が多かったので一般化できない
・対象を層化していないので、EPTが特に効果的な層はわからない

【批判的吟味】★★★★
解析は一部理解困難でしたが、全体的なフレームはシンプルでわかりやすいし、基本に忠実ないい研究だと思います。ただ、気になる点はいくつかあり

・発症3ヶ月ってそもそも急性期?
・Fig.2みると腰痛には効果ありそうだが、下肢痛には微妙
 - 実質みてるのは急性期の下肢痛じゃなく亜急性期の腰痛では…
・ODI差5.4ってピンとこない
 - 妥当なのはMICD達成者割合の比較
 - 盲検化できない状況での自己記入調査票の結果は怪しい
 - 効果ある!と言い切るには弱い気が…
・4Wから6Mの期間の治療情報がない
 - かなり他の治療の影響を受けそうなのも気になる

などなど、ほんとに急性期の坐骨神経痛(主に椎間板ヘルニアによる)を扱う我々脊椎外科医の臨床感覚からすると違和感も少なくありません。RoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 High risk 
3. アウトカムの追跡 Low risk
4. 評価者の盲検化 High risk
5. 選択的な報告 Low risk

RCTの質としてはちょっと厳しいかなと。本研究では割付の盲検化が治療者にも患者(=ODI評価者)にもできないのが最大の弱点であり「2.割付の盲検化」と「4.評価者の盲検化」がHigh risk。アウトカムの追跡が89%なのも痛いですが、「補助変数まで使った多重代入法で感度解析」までしているので「3.アウトカムの追跡」は甘めにLow risk。ただ、この研究疑問ではやむを得ないかと(じゃないとAIM載りません…)。まとめると、研究としては頑張ってるけど、結果は信用ならんといったところでしょう。

【コメント】
脊椎疾患には治療選択肢が少ないことが悩ましく、リハビリに効果あることが示されれば非常にありがたいです。ただ、リハビリは侵襲が小さくRCTが組みやすい一方、multimodalで標準化と一般化に難があり、質の高い研究が極めて難しい領域です。リハビリの世界にも臨床研究力を持った医者やセラピストが増えるといいなと思います。

脊椎領域には怪しいシステマティックレビュー(SR)が多い(すぎる)ので気が進まないのですが、EA通知でJBJSのSRがきたので読んでみます。ネタは非常に興味深い純粋な頚神経根症の手術に関するSR。オランダの研究チームから。

Surgical Interventions for Cervical Radiculopathy without Myelopathy: A Systematic Review and Meta-Analysis

臨床疑問  :頚神経根症に最善の術式は?
研究デザイン:Systematic Review
セッティング:全世界

P 脊髄症を伴わない頚神経根症
I 各術式
C 他の術式 
O 主要:成功率
副次:復職、再手術、合併症、機能、疼痛
 
外側ヘルニアによる、頚髄症を伴わない神経根症の手術には前方手術(固定or非固定)と後方除圧があり、どの術式がよいかはわかっていない。いくつかレビューはあるものの、頚髄症を伴う例の扱いが曖昧で対象集団が不明瞭であった。そこで神経根症に焦点をあてたSRを行いました!という研究。

【方法】
・包含基準は
 1) 純粋な単椎間の頚神経根症を対象
 2) 前方法か後方法をあつかう(比較対照あり)
 3) 成功率、機能か痛みを測定
 4) RCT
・対象は英もしくは蘭の文献に限定
・プロトコルはPROSPEROに登録
・データベース毎の検索タームは付録に添付
・成功率はOdom criteria
 - 機能はNDI、疼痛はNRS(上肢・頚部)
 - 無症候性でも隣接障害は合併症に分類
・RoBツールで包含研究の質を評価
・発生数0は+1してメタアナリシスに使用

【結果】
・21RCTを包含
・登場した治療法はは多岐にわたる
 - 前方は自家骨固定(ABG)、ABG+プレート(ABGP)、
   除圧のみ(ACD)、椎間孔除圧(ACF)、
   除圧固定(ACDF)、ACDF+プレート(ACDFP)、
   スペーサーのかわりにPMMA、人工関節置換(CDR)、
 - 後方は椎間孔除圧(PCF)、ほかリハビリ(PT)
・強い差が出たのはごく少数の比較のみ
 - 成功率 ACD vs ACDF RR 0.87 (0.77, 0.98) 
 - 合併症率 ABG vs ACDF RR 3.40 (1.56, 7.43)
*各比較の結果は多すぎるので割愛(フォレストプロットご覧を)

で、どの術式も似たり寄ったりでしたとの結論。

【批判的吟味】
★★★★
PROSPEROにも登録されているし、PRISMAガイドラインにのっとってるし、丁寧な研究でした。何より読みやすかったのがよかったです(Cochrane reviewと考えたら逆に物足りない感はありますが)。指摘する点としては

・GRADE評価(エビデンス総体の評価)がない
 - 治療法が多様すぎ決定的なことが言えないので不要?
・21もRCTがあるというのはちょっと?
 - オランダ国内限定のRCT数も知りたかった
・この研究疑問でRoB満点が3/21ってほんと?
・Proportionではなくrateを使っていた点に違和感
・アウトカム測定時点がバラバラなのは無視?

くらいでしょうか。

【コメント】
このデザインなら頑張れば手が届きそう!どこかで全力で1本SRしてJBJS目指すのもアリですね。てかJBJS載せるならそれが一番近道かも。その前にしなきゃいけない仕事が山積みですが…というかどうせ結果出ないの最初からわかってるのによくSRやったなぁ…そしてよくJBJS載せたなぁ…

このページのトップヘ