二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ:手術あれこれ > 頚椎

次はSpineに載ったRCTの検証。頚椎固定の際、安全にできるなら椎弓根スクリュー(CPS)使いたいところですが、センスない外科医にとっては敷居が高く。ロボットに手伝ってもらったら精確に打てる?RCTだけどEAの評価は低めの星4つ。

Improved Accuracy of Cervical Spinal Surgery With Robot-Assisted Screw Insertion: A Prospective, Randomized, Controlled Study.

研究疑問  :ロボット支援は頚椎スクリューの精度を向上する?
研究デザイン:RCT
セッティング:中国単施設(2015~2018年)

P スクリュー固定が必要な頚椎疾患 127人
I  ロボット支援設置 61人
C 透視下設置 66人
O 主要 :計画した位置からの逸脱
副次 :手術時間、出血、入院期間、合併症(4Mまで)

【方法】
・除外基準は重度の骨粗鬆症や並存症など+不適格と判断した例
・1:1の単純ランダム割付
・逸脱は術前計画CTと術後CTを重ねて評価
 - Gertzbeinの尺度(GradeA~E;2mm間隔)
・サンプルサイズは事前調査での差約0.8mmを検出する設計
・解析は検定のみ、対象はPer-Protcol集団

【結果と結論】
・適格者は198人でランダム割付135 人(68%)
 - ロボット群6人、X線群2人は術前に脱落
・使用したスクリューは
   ロボット群 LMS 26% 歯突起 9% Marerl 19% PS 46%
   X線群 LMS 34% 歯突起 10% Marerl 12% PS 44% 
・逸脱はロボット群 0.8 (0.4, 1.3)mm vs X線群 1.8 (1.4, 2.5)mm
 - GertzbeinのGradeは
   ロボット群 A 88% B 11% C 1%
      X線群 A 61% B 30% C 7% D 2%
・その他アウトカムでロボット群 vsX線
 - 手術時間 220 (150, 300)分 vs 210 (150, 255) 分
   出血 200 (50, 375) ml vs 350 (100, 500) ml 

というわけでロボット支援だとより精確にスクリューうてますよとの結論。

【批判的吟味】★★★
全体的にはバイアスが入りにくい研究疑問/デザインの、いい研究だと思います。ただ気になる点は結構たくさんあって、
 ・中国産(しかも単施設)
 ・スクリュー固定が必要な頚椎疾患って何??
 ・単純ランダム割付なのにキッチリ1:1に分かれすぎ
 ・検出したい「0.8mm」は臨床的に重要か?
 ・三次元のCTでどう逸脱を定量化したか不詳
 ・難易度が全然ちがう挿入法を丸めて対象にしている
 ・解析が単純な検定だけ
などでしょうか。ぶっちゃけCPS以外でロボット使う意味あまりないし、対象はCPSに限定すべきだったと思います。早く数集めて発信したかったんでしょうけど。RoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 Low risk 
3. アウトカムの追跡 Low risk
4. 評価者の盲検化 Low risk
5. 選択的な報告 Some concerns

RCTの質としては高そうです。プロトコルにアクセスできない点以外はバイアスリスクは低いかと。

【コメント】
中国の怪しい論文や査読たくさんみてきたので、やっぱり色眼鏡でみてしまいます。ズルしてるんじゃないか?と…日本も一緒か。バイアスリスク低いRCTなのにJBJSに載らないってことは、やっぱりそうなんだろうなぁ。EAも評価高くないし。

今回もSpine輪読会の流れで、Spine最新号を読みます。外来やっていて正直ストレスでしかない「ムチウチ」についての論文。症状にかなり心理的要素が入るネタを、どう研究したのでしょうか?意見書書くときの資料になり得るかなぁ。

The Course of Orofacial Pain and Jaw Disability After Whiplash Trauma: A 2-year Prospective Study.

研究疑問  :①ムチウチ後の顎痛その他の有病割合は?
       ②それらの症状は2年後どうなっているか?
研究デザイン:前向きコホート
セッティング:E群はUmea大学病院、C群は広告募集

P ムチウチ外傷あり+なし
E ムチウチ外傷あり
C  なし
O  2年後の頚/顎痛、頚/顎機能障害、身体精神不定愁訴など
*Cは年齢・性別をマッチしたUmea地区の住民
*EはQuebec Task Force分類でⅠ~Ⅲ
 - GradeⅠは頚部症状の訴えのみ
 - GradeⅡはⅠ+身体所見あり
 - GradeⅢはⅠ+神経所見あり
*測定は質問紙
*顎痛はNRSと3Q/TMDで測定
 - 3Q/TMDの一般人口における陽性的中率は74%
*解析はとにかく検定(ボンフェロー二補正)
 - 各アウトカムの群間差、群内差をひたすら検定
*「Drop out解析」で脱落者の性質に差がないことを検証

ムチウチによる外傷性頚部症候群(WADs)患者の訴えは多様で、一部(~半数)歯と関連しない顎痛を訴える場合がある。その発症時期や経過に一定の見解がないので、今回前向き調査してみました!という研究。結果は

・追跡割合はE群68%、C群90%
・E群でベースラインに顎痛ありの68%が2年後も顎痛が残存
・ベースラインの顎/頸痛の強度は、2年後のそれと相関
・顎/頸痛みは身体精神不定愁訴と相関

で、結論は以下。

・顎痛と頚部痛関連顎機能障害は受傷直後から存在
・そして慢性期も大部分持続する
・ので、ムチウチ後は頚部症状に加え口腔顔面領域のfollowも必要

【批判的吟味】★★
せっかく前向き調査なのに、「何が調べたいか」がもうひとつはっきりしない、検証したい仮説が明確ではないのが残念です。とにかく手あたり次第に調べて、データが集まってから何かを捻りだそう!と解析しているので、前向きにするメリットが活かせていません。そして悉皆調査ではなく、「広告で募集したボランティア」をC群にして、E+Cで作ったコホートを対象にするのも様々な問題があります(長くなるので書きませんが…)。どのようにC群を募集したかの記載がないので、E群とC群の比較が妥当なのか判断することもできませんし。ほかにも

・ボンフェロー二補正したのに有意水準は0.05?
・群間で22回、群内で16回検定は何をどう補正しようが検定し過ぎ
変化量の比較は困難なので、マクネマー検定でも強いことは言えない
・本研究で行った「Drop out解析」では欠測がランダムとは主張できない
 - ので、E群だけが68%も欠測しているのは厳しい

などイロイロ問題があり、結果をどう解釈していいかは残念ながら謎です。

【コメント】
やっぱり害はないけど、益もないというか…So What?というか…スウェーデンでもムチウチで皆困ってるんだな!と共感できたのと、意見書書く際に文献として引用できそうな点は有益ですけど。前向き研究を完遂した労力には賞賛しかないですが、せっかくするならちゃんとデザインしないと勿体なすぎます。やっぱりSpineはネタのimpactのみ、で載るのか?と穿ちたくなる、もの寂しい研究でした。まさか前向きコホート!だから採用、という判断じゃないよね…

まだITS通信講座40%ちょっとしか終わっていませんが、現時点で取り掛かっている研究の解析まで最低限できるようになりましたし、受講期限もまだ1ヶ月あるので、ちょっと休憩。Spine最新号に載った論文を「ジャケ読み」してみます。やっぱり脊椎関連の論文の方がヤル気がでます。

Cervical Spine Fractures Who Really Needs CT Angiography?

研究疑問  :頚椎骨折新規アルゴリズムは不要なCTAを減らせるか?
研究デザイン:過去起点コホート
セッティング:ピッツバーグ外傷センター
*既存のアルゴリズムは以下
 - ACS(American College of Surgeons?)基準
 - ACSに神経所見を加えた?拡張Denver Criteria(EDC)
*新たなアルゴリズム(PA)の詳細は以下

大基準
1.高エネルギー外傷
2.意識消失あり
3.精神状態の変化もしくは気道確保困難
骨折基準
1.横突孔骨折
2.C1C2の複合骨折
4.両側facet骨折
3.facetの破綻

大基準でYES≥2  CTA
大基準でYES=1 →骨折基準でYESがあればCTA
大基準でYESなし CTAしない

P 外傷センターを受診した頚椎骨折 721人
E PAで評価
C1 ACSで評価
C2 EDCで評価
O CTA必要と判断した数
*受傷1D以上経過、脳血管損傷が明らかな例は除外
*CTAは全例ではなく、PA基準を満たした例+脊椎外科医の判断で追加
 - 417人(58%)

頚椎骨折がある場合は椎骨動脈鈍的損傷(BCVI)に注意すべきだが、CTAを撮りまくっても偽陽性は多いし、対象を絞る必要がある。既存のクライテリアはもう一つなので、ウチで使っている非脊椎外科医用の2段階アルゴリズムを既存のACSやEDCと比べてみました!という研究。CTAを必要としたのはPA 261人 (36.2%) vs ACS 413人 (57.3%) vs EDC 417人 (57.8%)とPAが最も少なく、結局stroke起こしたのは7例(すべてPA陽性でCTA施行=見逃しはなし)で、PAは不要なCTAを減らせて有用でしょうとの結論。

【批判的吟味】★★
研究目的、アウトカムや比較の方法などが構造化されていないので、「どういう研究」なのか掴みどころがありません。最終的にみたいのが「Stroke」なのか、その手前の「BCVI」なのかもはっきりしませんし。前者をアウトカムにするなら7例だけなので数が少なすぎるし(ほんとはこれしたかったんでしょうけど)、「BCVI」なら、CTAした(BVCIの有無が確認できた)のが全体の60%弱しかいないので評価不可能です。

要するに、「データをとってから考えた研究」あるあるで、無理して結果(P値)出そうとしてロジックが壊れてしまっています。わかりやすいし、臨床では是非PA使ってみたいのですが、残念ながら本研究からPAの良し悪しを論じることはできません。まぁ頚椎骨折後の遅発性Stroke発生割合が1%くらい?ってのは興味深い数字ですが。

【コメント】
ウチではこんなことやっていますよ!的な介入が科学的根拠なくSpineのエビデンスになったという事実。本件は臨床的にも問題なさそうですが、このパターンで誘導的(恣意的)なエビデンスが出る可能性もあるってことで、EBMの信頼度って今後どうなっていくかちょっと不安になる論文でした。Spine数打てば当たるかも…開き直って書きまくる?

Spineに掲載された傾向スコア(PS)シリーズ第三弾、これでひと段落でしょうか。これまでの2本はお手本になるような使い方ではなかったので、今回に期待です。頚椎前方椎体摘出術(ACC)において、顕微鏡使うかどうか?を調べた研究。どっちでもいいやん!という意見はさておき...

Propensity-matched Comparison of Outcomes and Costs After Macroscopic and Microscopic Anterior Cervical Corpectomy Using a National Longitudinal Database.

研究疑問  :顕微鏡下のACCは成績がよいか?
研究デザイン:過去起点コホート
セッティング:Thomson Reuters MarketScan Commercial Claims and Encounters Database, MarketScan Medicare Supplemental and Coordination of Benefits Database
*前者は勤務者とその家族を対象に、(たぶん)医療行為と検査データが格納
*後者はMedicare受給者とその家族を対象
*2007~2016のdataを使用

P ACCを施行した患者
E 顕微鏡下 4298人
C 直視下 4298人
O 合併症(30D)、入院期間、再入院・手術(30/90D)、疼痛管理、退院先、医療費
*後方固定、腫瘍、外傷、脊柱変形、保険加入1年未満を除外
*並存症と使用機器でPSを計算
*PSを用い1:1マッチング
*マッチングのキャリパーはPSのロジットの標準偏差の5%に設定
*解析は検定(多重検定はボンフェロー二補正)

頚椎前方椎体摘出術(ACC)は大変だけどアメリカでは増えてきている。椎間板切除においては顕微鏡の使用がよさそうだが、時間もコストもかかるので一概にいいとは言えない。とりわけ頻度の少ないACCで顕微鏡を使うべきかは全くわかっていないので、今回国家データベースを用いて調べてみました!という研究。入院期間はE群が有意に短く(1.56泊 vs 1.86泊)、再入院も少なく(30D:3.2% vs 4.2%、90D:5.9% vs 7.0%)、自宅退院が多く(92.5% vs 86.6%)さらに医療費は殆ど変わらなかったとの結果で、ACCにおける顕微鏡使用はいくつかの利点がありそうだよ!という結論。

【批判的吟味】★★★
これも前々回の論文と同じく、RCTが何かと難しい術式の良し悪しをみる研究疑問を解明するうえで、ビッグデータで準実験デザインをやるという王道的な研究。向学のためにどの程度ちゃんと限界(と言い訳)述べてるかさっくり列挙しますと...

・支払者のデータベースなので誤分類がある
 ←でも両群に均等に発生しているはず(なので影響は小さい)
・保険でカバーしていない集団のことはわからない
 ←でもサンプルサイズ大きいし、PSマッチングで背景揃えてる
・画像所見、身体所見や長期のデータはない
 ~言い訳なし

うーんちょっと苦しいか。2番目の言い訳は支離滅裂ですね。術式選択にかかわる「適応交絡」の調整がキモで、そのためには最後に述べている「画像所見」「身体所見」など疾患種類や重症度にかかわる情報がないのが最大の弱点なわけです。重要な未測定交絡があるわけで、「ビッグデータでPSマッチングしたからいいでしょ」みたいな言い訳は余計に創を広げるだけ...高次元PS使えたらもうちょっといいのでしょうか(触ったことないけど)。「雇用者とMedicare受給者」が源泉集団をどの程度代表するかなどの解説ももっと欲しかったですし(結果がどの程度臨床に活かせるかよくわからないので)。

【コメント】
でもやっぱりビッグデータはあると良いですね、羨ましい。データさえあれば、このくらい(といったら失礼ですが)の研究ならできそうです。もっとガチでやったらBMJ目指せるんでしょうけれど、私にはまだまだ実力不足...というか、外傷でも腫瘍でも脊柱変形でもないのにACCしまくってる!?そしてACCなのにインスツルメンテーションしていない例が5%も!?入院期間も平均2日以内...アメリカいっぺん観にいかないといかんですね。世界に目を向けなきゃ、善し悪しは別としてガラパゴス...

12.2-12.7までSICOT(Oman)に参加し、Livedoorにアクセスできなかったこともあり更新が滞っていましたが、やっと少し落ち着いたので再開しようと思います。ここ数日はSpineを続けて読んでみます。まず中等度の頚髄症(mCSM)についての報告。

Treatment of Mild Cervical Myelopathy: Factors Associated With Decision for Surgical Intervention.

研究疑問  :mCSMに手術するかに関連する要因は?
研究デザイン:前向きコホート
セッティング:Canadian Spine Outcomes Research Network(7施設)

P CSM患者(mJOA≥15) 122人
E 各リスク要因あり
C 各リスク要因なし
O 手術施行 105人(86%) *頚椎手術歴、緊急手術、他の神経疾患の合併例は除外
*以下要因クラスタごとにbackward conditional selectionにかけ
 残った変数を組み合わせて最終モデルを構成
 背景:年齢、性、BMI、既婚、住環境、教育、喫煙、運動習慣、並存症
 臨床:罹患期間、NRS、投薬と期間、症状の強度、画像パラメータ
 自己:NDI、SF-12(MCS・PCS)、PHQ9、EQ5D、mJOA

mCSMを手術した方がいいかどうかのエビデンスは不十分である。よって保存治療が奏功するmCSMを特定していく必要があるが、そのためにはまずどういうmCSMに手術が行われているかの調査が必要となる。ので今回探索してみました!という研究。各要因クラスタの解析モデルでは背景要因でBMI、臨床要因で投薬期間、自己要因でEQ5Dが残り、最終モデルではEQ5Dが残ったとの結果で、EQ5Dが悪いmCSM患者は手術ありと関連していたとの結論。

【批判的吟味】★★
意図はよくわかるし、「mCSMにどこまで手術するか」は切実な疑問だと思います。が、その疑問の解決のために「どういうmCSMに手術が行われているか」を調べるのはそもそもロジックが微妙かと。しなきゃいけないのは
 
 ①mCSMを対象に、手術の有無で予後を比較(観察研究)
 ②(特定の)mCSMに対しRCT

だと思います。もしビッグデータでしっかり解析できたら②は不要かもしれませんが。仮に「どういうmCSMに手術が行われているか」を調べるとしても、まずすべきなのは代表的な術者を対象とした質的研究や意見集約調査(デルファイ法など?)でしょう。さらに恐らくサンプルサイズが小さいのでそうしたのだと思いますが、まずわざわざクラスター毎にモデル組んで、さらに最終モデルも組むという手法もピンときません。本研究のモデルで表現したいのは手術を決定した術者の頭の中ですが、この流れで果たして説明がつくのか...サンプルサイズも小さいですし、臨床経験や過去の知見をもとに変数は事前に絞るべきでしょう。調べたいことありきで研究するというより、手元にあるデータからこじつけた印象が否めません。

【コメント】
前向きコホートといっても多目的コホートだし、臨床疑問も解析も浅いのが残念…spineこれで載るんなら、dataさえあればどうにでもなるってことか…

このページのトップヘ