二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ:ひとり抄読会 > ★★★★★論文

忙しさにかまけてなかなかEAをチェックできていなかったので、臨床の隙間時間を利用してみてみると…100文献以上たまっていました涙。殆どが私には直接関係ない整形絡みの論文ですが、なかに相当重要な論文を発見!「頚髄症手術は前から後ろからどっちの方がよい?」という、古来より結論が出ていない臨床疑問に対し、なんとJAMAにRCTが…これは読んでおかないと完全なモグリです。いったいどこの国から?とみてみるとやっぱりアメリカの多施設。さすが…

Effect of Ventral vs Dorsal Spinal Surgery on Patient-Reported Physical Functioning in Patients With Cervical Spondylotic Myelopathy: A Randomized Clinical Trial

研究疑問 :頚髄症(CSM)では前方>後方か?
研究デザイン :RCT
セッティング :北米15施設
*2014.4.1~2018.3.30

P 多椎間CSM(45~80歳)
I 前方除圧固定 63人
C 後方除圧もしくは除圧固定 100人
O 主要:SF-36(PCS, 1Y)
  副次:JOA, 合併症, 就業, SVA, Health resourceの使用?, NDI, EQ-5Dなど

CSMの手術は年々増えていて(2009年にnational health優先課題100に選抜)、米国では術後の頚部痛の少なさから前方除圧固定が良いとされる。でも結局前後どちらがよいかはっきりわかっていないので、調べてみました!という研究。

【方法】
・プロトコルと解析計画書を付録で添付
・CMSの定義は以下
 ①症状所見で以下2つ以上
  - 手の痺れ、歩行障害、深部腱反射亢進、バビンスキー陽性、膀胱障害、クローヌス
 ②2椎間以上の病変
・除外基準は以下
 - C2-7の後弯が5°以上
 - 前方骨棘が3椎間以上
 - 大きな骨棘やOPLL
 - 過去の頚椎手術既往
 - ASA4以上
・15人の専門家パネルが臨床的にequipoiseか(RCTして問題ないか)判定
 - 12人以上の合意
・5or10の置換ブロックで2:3に割付
・後方除圧の場合固定追加するかは術者の判断
・ランダム割付拒否/ランダム割付が不適格な患者もコホートとして追跡
・PCSは偏差値に変換
 - MCIDは5を採用
 - α0.05、パワー90%、脱落15%で必要サンプルサイズは159人
・中間解析は行わず、モニタリング委員が合併症を観察
・主解析(PCS)は線形混合モデル
 - 術者を変量効果、ベースラインPCS、介入、時点、介入×時点で構成
・他の解析も同様のモデル
 - 2値アウトカムはカイ二乗検定

【結果と結論】 
・潜在適格者458人中269人が参加、163人がランダム割付
・1年追跡は前方60/63人、後方95/100人で合計95%
 - 2年追跡は80%
・1年時のPCS改善は
 前方5.9 vs 後方6.2 で差0.3 (-2.6, 3.1)
・副次アウトカムの殆ど差なし、差があったのは以下(前方 vs 後方)
 - 合併症割合 48% vs 24%で差24% (8.7, 38.5)
 - 嚥下障害 41% vs 0%
 - 神経症状悪化 2% vs 9%
 - 再手術 6% vs 4%
 - 1ヶ月再入院 0% vs 7%
 
このように、別に前方が優れているという結果がでなかったとの結論。

<向学のためにlimitationのまとめ>
・椎弓形成をランダム割付できなかった
 - 椎弓形成をしているのは5/15施設しかなく米国では一般的ではないので
 - なので、事後解析のため後方群を多めにした
・Nが少ないのでサブグループ解析は微妙
・後方術式選択にバイアスが入っているかも
 - 除圧のみと除圧固定の適応は今後の課題

【批判的吟味】★★★★★
めちゃくちゃ頑張らないシンプルなデザインでも、ネタが重要で丁寧にやればJAMAに載るという夢のある論文。まぁ「優先課題100」だったり、JAMAのお国元である北米の研究ってのも大きいでしょうけど。前方か後方かサイコロ振って決めさせろ!というのもよほど有名な病院じゃないと患者逃げちゃいますから、民間病院ではできないですが涙。RoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 Low risk
3. アウトカムの追跡 Low risk
4. 評価者の盲検化 Some concerns
5. 選択的な報告 Low risk

RCTの質としてはかなり高いかなと(じゃないと今の時代JAMAには載りません)。欠測は約5%と少ないし、術式のクロスオーバーもかなり少ない。自己申告だし、PCSだとちょっと緩い気はしますが他にないんだから仕方ない。Flow chartの始まりが包含基準満たした対象じゃなく、その前の「Patients screened」になっているのもTop journalならでは。スタートの458人から、参加拒否とかランダム割付拒否で落ちたのが26人しかいないって俄かには信じがたいですが…そんだけ強い施設の研究なんでしょう。羨ましい限り…

【コメント】
というか、メジャー施設15のうちLaminoplastyしてるの1/3しかないとかアメリカどうなってんだ!?頚髄症で固定要る人そんなに多いとはとても思えない…どうやら北米は頚髄症後進国なので、カッチリした頚椎の研究は日本発で発信する余地が大分ありそう。だから頚椎後方はアジア発の論文が多いのか…日本での臨床経験しかない田舎者なので、なかなかピンときませんが。これは探せばネタはいくらでもありますね…時間がないけど涙

先日介入の効果をみる前向きコホート研究(非RCT)を読みましたが、引き続きお手本となるコホート研究を読んでみます。ある特徴が将来のアウトカムと関連するか?という予後をみる研究については、前向きコホート研究が最強になります。まぜなら「ある特徴」は介入と違ってランダム割付することができず、RCTが不可能だからです。それこそ研究デザイン力が結果の精度に大きく影響する臨床疑問になります。やぱりお手本なんで、JAMA様から…

Long-term risk of incident vertebral fractures


研究疑問 :低骨密度(BMD)は将来の骨折と関連するか?
研究デザイン :前向きコホート
セッティング :Study of Osteoporotic Fractures(SOF)
*1986年に開始、米4施設で構成

P 高齢白人女性(平均年齢69歳)
E   既存骨折あり
C 既存骨折なし
O 新規骨折

P 高齢白人女性(平均年齢69歳)
E   低BMD(単位は1SD)
C BMD正常
O 新規骨折

以前に低BMDと椎体骨折の関連、および既存椎体骨折と続発椎体骨折との関連について報告したが、平均3.7年のfollowと短かった。ので、15年以上観察した報告をまとめてみますとの研究。

【方法】
・細かな研究計画は先行研究参照
 - 黒人女性はリスクが低いので含んでいない
・研究参加9704人
 - 第8回調査対象は4284人(44%)
 - 実際に受診したのは2797人(29%)
 - うちX線が撮れて、読めて、ベースラインX線もある2680人(28%)を解析
・X線ではT4-L4の前方・中央・後方椎体高を測定
 - まず盲検化された3人でスクリーニング
 - 各X線で一番変形が強そうな椎体を、正常/微妙/たぶん骨折に評価
 - たぶん骨折だけ細かく測定
 - ランダムサンプル503人で試し測定
 -感度は「既存骨折」「新規骨折」それぞれ97%, 100%
・「既往骨折」の判定には前方/後方、中央/後方、後方/尾側椎体の後方を使用
 - いずれかが3SD未満の場合に「既存骨折」
・「新規骨折」の判定には前方、中央、後方を使用
 - いずれかが20%もしくは4mm減高で「新規骨折」
・BMDは踵骨、橈骨、大腿骨、大腿骨頸部、腰椎で測定

<解析>
・まず本研究対象2680人と非対称7024の背景を比較
・骨折時期はわからないので(Coxではなく)ロジスティック回帰
 - まず年齢と施設で調整
 - 続いてさらに骨粗鬆症加療、非脊椎骨折既往、BMI、喫煙習慣で調整
・ 年齢/施設モデルでROC解析(各BMD部位で)
 - さらに70歳以上/既存骨折で層化した解析も
・BMDと既存骨折で絶対リスクを算出

【主な結果と結論】 
・487(18.2%)に新規椎体骨折が発生
 - 既存骨折ありは163/394(41.4%)、なしは324/2286(14.2%)
 - 既存骨折のオッズ比は4.21 (3.33, 5.34)
・低BMD(1SD単位)も新規骨折の発生と関連
 - (大腿骨で)オッズ比 1.78 (1.58, 2.00)
・大腿骨BMD‐2.5SD未満+既存骨折ありの新規骨折発生は56%
 - 一方BMD正常で既存骨折は9%

既存骨折ありと低BMDはいずれも独立した新規骨折のリスク因子であり、既存骨折があり更に低BMDなら注意!との結論。

<Strength / limitationのまとめ>
・地域住民を対象とし、サンプルサイズが多く、15年目のX線を用いている。
・高齢白人女性以外(他の人種や男性)に結果が当てはまるかは不明
・生存者の多くが再診したが、再診しなかった人よりベースラインが健康だった
 - ので、骨折リスクを過小評価している
・腰椎と大腿骨のBMDはベースラインの2年後に測定
 - でもベースラインで測定した踵骨や橈骨とかわらない結果

【批判的吟味】★★★★★
アメリカやっぱ規模がすごいです。この研究幾らかかってるんだろ…ここまでやれば観察研究でもJAMAに載るんですね。解析は(私でもわかるような)シンプルなものですが、当時は旧き良き時代だったから?ツッコむところがあるとすれば、観察研究なんで交絡の調整は十分か?というところ。パーキンソン病、ステロイドはじめとした二次性骨粗鬆症…骨折と関連する疾患は相当たくさんあります。ただ、だからといってこの研究の結果が覆るとは思えませんし、結果に異論を唱える人はいないでしょう。ちなみにこれを「高齢日本人」で調べるのも重要かも(日本人だけ対象でJAMAに載るかはわかりませんが…)。

【コメント】
PubMedでSOFをひくと約30の文献が…やっぱり大きなコホート研究は枝論文が結構でますね。かく言う私も福島医大/京大のコホート研究の脛をかじりまくらせていただいています。「予後をみる研究」はRCTできない分、コホート研究頑張れば最善のエビデンスが出せますので、それこそ脊椎絡みの多目的コホート研究、多施設でできないかなぁ…「介入の効果をみる研究」のための疾患特異的レジストリも必要ですけど。

本日は私の人生の転帰ともなった臨床研究デザイン塾でした。コロナ渦の影響でWeb開催になったのですが、これはこれでコンパクトにまとまっていい会だなぁと改めて刺激をいただきました。私の班の皆さんもそうだったのですが、やはり臨床医が一番調べたいのは「介入の効果」だなと再認識。理想としてはRCTでしょうが、費用面ほか高根の花、というか非現実的。じゃあどうしよう?というのが切実な問題です。RCT頑張っても選択バイアスは問題ですし。個人的には前向きコホートしかないんじゃないかな?と思っています。ので、今回はお手本として「介入の効果をみる前向きコホート」を読んでみます。JAMA様なら間違いないでしょう!

Surgical vs nonoperative treatment for lumbar disk herniation: the Spine Patient Outcomes Research Trial (SPORT) observational cohort


研究疑問 :腰椎椎間板ヘルニア(LDH)に手術は有効か?
研究デザイン :前向きコホート
セッティング :Spine Patient Outcomes Research Trial(SPORT)
*RCTとRCT拒否者で構成された前向きコホートで構成
*米11州13施設

P LDHによる根症状(6W以上)がある患者
I 手術
C 保存(指導、PT、NSAIDsなど)
O 主要:SF-36(BP/PF)、ODI(3M, 6M, 1Y, 2Y)
  副次:治療成功感、就業、満足感、坐骨神経痛

SPORT(RCT)におけるITT解析では手術と保存に差が出なかった。でもRCTは一般化に問題があるし、介入が定期手術なのでクロスオーバー(手術群⇄保存群)がITT解析の結果を歪める。ので、SPORTでは前向きコホート研究もするんですよ!という研究。

【方法】
・細かな研究計画はプロトコル論文参照
・看護師が適格者を抽出し、RCTか観察研究への参加を提案
 - 観察研究を選んだ患者は医師を受診
 - 手術かそのまま保存かを自己選択
・手術はopen diskectomy
・坐骨神経痛の程度はSciatica Bothersomeness Indexで測定
・アウトカムはベースラインからの変化と改善者の割合として比較
 - 保存群は割付時をベースライン、手術群は手術直前をベースライン?
 - 測定日がズレた場合は、線形補完した平均値を使用
・解析モデルには欠測とアウトカムに関連する変数を投入
 - 複数測定の影響に変量効果モデルを使用

【結果と結論】 
・潜在適格者1991人中1244人がSPORTに参加
 - 743人が前向きコホートに参加(手術希望521人/保存希望222人)
・参加者の97%が1回は測定でき、解析に組み入れ
 ‐ 各測定時点での測定割合は82‐89%
・手術⇄保存のクロスオーバーで結局手術528人/保存191人
・保存治療の内訳以下
 - 指導92%、NSAIDs58%、麻薬系35%、PT43%、ブロック38%
・手術合併症は以下
 - 輸血2人、硬膜損傷2%、再手術1年7%2年9%(半分が再発で)
・主な効果は以下(手術 vs 保存)
 BP変化量 (3M) 40.9 vs 26.0 差14.8 (10.8, 18.9)
 PF変化量 (3M) 40.7 vs 25.3 差15.4 (11.6, 19.2)
 ODI変化量(3M) -36.1 vs -20.9 差 -15.2 (-18.5, -11.8)
 BP変化量 (2Y) 42.6 vs 32.4 差10.2 (5.9, 14.5)
 PF変化量 (2Y) 43.9 vs 31.9 差12.0 (7.9, 16.1)
 ODI変化量(2Y) -37.6 vs -24.2 差 -13.4 (-17.0, -9.7)

このように、手術群の方が改善がよかった!が、自己申告のアウトカムなので解釈は慎重に行うべきであるとの結論。

<向学のためにlimitationのまとめ>
・適格基準が厳しいので、結局一般化に支障
 - 6W我慢できなかった人が含まれていない
 - でもガイドラインでは6W待つわけだから影響は小さいでしょ
・保存的加療は多様すぎる
 - 一部無効だったり有害だった場合に手術の効果を誇張
 - でもだいたいどの治療も効果あるとされている
・欠測が14~18%あった
 - でも複数の感度解析で結果が覆らないことが示された
・盲検化されていないうえに、アウトカムが自己申告
 - 後療法への意欲、期待、変化への気づきなどが結果を修飾
・すべての患者や術者の要因を考慮することは不可能
 - 未測定交絡がどの程度結果に影響しているかは不明

【批判的吟味】★★★★★
どこかでSPORTの枝研究読んで、もう一つだな…と思っていたのですが、本家はすごかったです。もう15年前にこんなに丁寧な研究がされていたんですね、そりゃJAMAに載るのも納得。RCTと対じゃなく、この研究1本だけなら無理だったでしょうけど。思いつくLimitationは全部書かれていたし、突っ込み思いつきません。お手本にするには交絡や欠測の取り扱いの詳細がなかったのが物足りなかったのは残念ですが、プロトコル論文には書いてるのかな。てかプロトコル論文がSpineに載るってすごい…

【コメント】
PubMedでSPORTをひくと100以上の文献が…これだけ大きな研究に関われたら臨床家/研究者として一生の仕事になりますね。それにしても「非盲検化」「アウトカム自己申告」は相当手ごわい問題…結局1/3が研究参加自体を拒否しているので、選択バイアスも結構ありそうだし。でもこれ以上どうしたらいいんでしょうか…バイアスも含めて治療効果!患者良くなってたらそれでいいじゃん!という考えもあるでしょう。でももし結果がバイアスからきてるなら、手術してなくても良くなってたじゃん!ということになるんですよね。手術の純粋な効果をみるのはホントに難しい…(てかシャム手術しないと無理?)

ちょっと論文が読めそうなスキマ時間ができたので、EAをcheckしてみます。脊椎関連で面白そうなのはないな~とみていると、NEJMに慢性硬膜下血腫(ChSDH)のRCTが!なぜか脳外科なのに関注とかしている私ですが、たまにChSDHの相談受けることもあるので臨床的意味合いでもちょっと読んでみます。

Trial of Dexamethasone for Chronic Subdural Hematoma.

研究疑問  :症候性ChSDHにデキサメサゾンは効果あるか?
研究デザイン:RCT
セッティング:英多施設

P 症候性のChSDH 748人
I  デキサメサゾン8㎎×2/Dをテーパリングしながら2W
C プラセボ
O 主要:mRS ≤3(6M)
副次:mRS(退院時/3M)、死亡、手術、GCS、
      Barthel Index、EQ-5D-5L、入院期間、合併症(高血糖など)
  第三:術後再発

ChSDHの穿孔洗浄術は2030年には米国で最多の脳外科手術になる見込みであるほど多いが、10~20%再発する。デキサメサゾンは再発予防や保存治療として有効性が期待されているが、エビデンスが限られているのでちゃんと調べてみました!という研究。

【方法の主なところ】
・プロトコルはTrialsで報告
 - 続いて7施設100例でパイロットRCT(SciRepで報告)
 - 安全性が担保されたのでそのまま本RCTに突入
・同意できない人からは法的代替者からIC取得
 - 代替者がいない場合は独立した医療従事者が代行
・手術を行うかどうかは治療者の判断
・デキサメサゾンのテーパリングは
 1-3D 8mg×2、4-6D 6mg×2、7-9D 4mg×2、10₋12D 2mg×2、13D14D 2mg×1
・退院後の内服の有無は処方歴と患者日記で追跡
・施設で層化した変動ブロック法で1:1に割付
・サンプルサイズは脱落15%のみつもりで750例と試算
 - mRS ≤3のベース割合80-85%に8%ptの上乗せ効果を期待
 - これは検出力81-92%
・解析はmITT集団
 - 参加拒否者、脱落者を除外
・主解析は検定
 - PerProtcol集団で感度解析

【結果と結論】
・「assessed for eligibility」は2203人
・対象の94%が手術を受けた(ので、手術回避効果は検証できず)
・mITT集団680人(91%)を解析
・主なアウトカムは(I群 vs C群)
 mRS ≤3(6M) 83.9% vs 90.3% 差-6.4%pt (-11.4, -1.4; p=0.01)
 再手術 1.7% vs 7.1% 差-5.4%pt (-8.7, -2.5)
    重度合併症 16% vs 6.4% OR 2.49 (1.54, 4.15; p<0.001)

で、参加者のほとんどが手術を受け、デキサメサゾンの使用は経過不良や合併症を増やすが再手術は減らしたとの結論。

【批判的吟味】★★★★★
ケンブリッジ大の臨床試験チームがバックについた、英国をあげた多施設研究ということで、非常に丁寧に遂行されたさすがNEJM!でした。だいぶん割愛しましたが、これでもか!というくらい方法もしっかり書かれていて、自分でRCTするときは是非もっと細読して参考にしようと思った次第です。これだけしっかりした結果出てるのに、結局デキサメサゾン使うの?という結論は一切触れず、読者の判断に任せる、というスタンスは素敵すぎる…RoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 Low risk
3. アウトカムの追跡 Some concerns
4. 評価者の盲検化 Low risk
5. 選択的な報告 Low risk

RCTの質としてはかなり高いかなと(じゃないと今の時代NEJMには載りませんよね)。欠測が約10%いたことを除いては完璧だと思いました。その欠測も対象が対象(高齢者で登録時にChSDHで症状出てる人)なのである程度は仕方ないでしょうし…Low riskでもいいかも。Flow chartの始まりが包含基準満たした対象じゃなく、その前の「assessed for eligibility」になっている真面目な研究初めてみました。

【コメント】
ChSDHにデカドロン使ったら手術回避できるかも?と期待しましたが、結果からすると使わない方が良さそう。だから臨床的意義も含めEA評価は5/7なんでしょうか。それにしてもいい研究…日本の脳外科も大学主導でこういう研究企画して欲しいです(場末の民間病院だと患者逃げちゃいますからそもそも不可能)。ただ、臨床研究の専門家(とガチの生物統計家)が入らないと確実にコケるので、そこが求められる土壌作りから涙…その前に自分が「疫学者」を名乗れるようにならないと…

8月中にドラフト書き上げるぞ!と臨床予測モデル(CPM)研究に取り組んでいます。お手本を探していると、やはり2011年と大分旧いですが、Lancetに脊損の歩行予後を予測するCPMが。当時は専門医試験の勉強のため毎週各地からオッサン3人で佐賀大学そばのJoyfulに集まって勉強したなぁ…という現実逃避はさておき、読んでみます。

A clinical prediction rule for ambulation outcomes after traumatic spinal cord injury: a longitudinal cohort study

研究疑問  :脊損後の歩行再獲得を予測するCPMを開発する
研究デザイン:前向き多目的コホートの二次?利用
セッティング:欧州19施設(開発2001~2008、検証2008~2009)

P せき損 492人
E 各リスク因子あり
C 各リスク因子なし
O 屋内独歩の再獲得(1Y)

頚損後早期に歩けるようになるかどうかは、患者のカウンセリングやリハビリ計画を立てるうえで重要、なのでCPMを開発します、という研究。

【方法】
・治療は標準化せず
 - 手術ふくめどうせ有効な治療はないので
・ベースラインは受傷15D以内
 - ベースライン欠測は除外
・リスク因子候補は年齢(≥65)、と神経所見
 - 各高位の筋力(5段階)と感覚(3段階)、Sacral sparing(2値)
 - 筋力は左右で強い方を採用
 - 使いやすさを考慮して複雑な変数は入れず
・歩行の評価にはSpinal Cord Independence Measueの項目12を使用
 - 0-8点、4点以上で屋内独歩可
・モデルの開発は
 - 各因子の関連が強いので、最大7因子で複数のモデルを作成
 - 赤池の統計量で適合度を評価し、最適なモデルを選択
 - 同点の場合は変数が少ない方を採用
 - β係数で重みづけしスコア化(どう丸めた?)
・モデルの性能評価は
 - 識別力はAUC
 - あてはまりはcalibration plotで図示

【結果と結論】 
・全体1442人中アウトカム欠測なしが492人(34%)
・最終モデルの項目と配点(範囲)は

  年齢≥65 -10点 (-10~0)
L3筋力 2点 (0~10)
S1筋力 2点 (0~10)
L3感覚 5点 (0~10)
S1感覚 5点 (0~10)
合計 (-10~40)


・開発コホートでの識別力はC統計量で0.96 (0.94, 0.98)
 - 検証コホートでは0.97 (0.94, 1.00)
・スコアの解釈はFig.2で図示...抜粋すると
 - 10点 約35%、15点 約67%、30点 99%

というわけで、年齢と4つの神経所見でかなり性能がいいCPMができましたよ!臨床試験にもつかえますね、という結論。

【批判的吟味】★★★★★
前向きといいつつほぼretroなデータで、Nもそう多くなく、細かな部分はさておき全体的に単純な解析。これなら頑張れば再現は不可能じゃないです。臨床使用を想定してモデルもシンプル。でもネタが切実で性能も相当いいとLancetに載る!という夢のある研究でした。サンプルサイズに言及していなかったり、complete-caseで解析する根拠が薄かったり、質の評価的には粗い点もあります。でもTRIPODがでる(2015年ころ?)前なので目をつぶるべきなんでしょうね。対応図(Fig.2)がopen accessじゃないので、結局臨床で使えねーじゃん…というのは極めて残念ですが。あと有効な治療ないとか言い過ぎっす…

【コメント】
私がモグリなだけかもしれませんが、このCPM知らなかったなぁ…Lancetに載っても流行らない?ということは、やっぱりCPMはだいたい作りっぱなしの運命なのでしょうか。まぁ兎に角やってみよう。実践、実践…

このページのトップヘ