二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ:疾患別エビデンス > 椎間板ヘルニア(LDH)

本日は私の人生の転帰ともなった臨床研究デザイン塾でした。コロナ渦の影響でWeb開催になったのですが、これはこれでコンパクトにまとまっていい会だなぁと改めて刺激をいただきました。私の班の皆さんもそうだったのですが、やはり臨床医が一番調べたいのは「介入の効果」だなと再認識。理想としてはRCTでしょうが、費用面ほか高根の花、というか非現実的。じゃあどうしよう?というのが切実な問題です。RCT頑張っても選択バイアスは問題ですし。個人的には前向きコホートしかないんじゃないかな?と思っています。ので、今回はお手本として「介入の効果をみる前向きコホート」を読んでみます。JAMA様なら間違いないでしょう!

Surgical vs nonoperative treatment for lumbar disk herniation: the Spine Patient Outcomes Research Trial (SPORT) observational cohort


研究疑問 :腰椎椎間板ヘルニア(LDH)に手術は有効か?
研究デザイン :前向きコホート
セッティング :Spine Patient Outcomes Research Trial(SPORT)
*RCTとRCT拒否者で構成された前向きコホートで構成
*米11州13施設

P LDHによる根症状(6W以上)がある患者
I 手術
C 保存(指導、PT、NSAIDsなど)
O 主要:SF-36(BP/PF)、ODI(3M, 6M, 1Y, 2Y)
  副次:治療成功感、就業、満足感、坐骨神経痛

SPORT(RCT)におけるITT解析では手術と保存に差が出なかった。でもRCTは一般化に問題があるし、介入が定期手術なのでクロスオーバー(手術群⇄保存群)がITT解析の結果を歪める。ので、SPORTでは前向きコホート研究もするんですよ!という研究。

【方法】
・細かな研究計画はプロトコル論文参照
・看護師が適格者を抽出し、RCTか観察研究への参加を提案
 - 観察研究を選んだ患者は医師を受診
 - 手術かそのまま保存かを自己選択
・手術はopen diskectomy
・坐骨神経痛の程度はSciatica Bothersomeness Indexで測定
・アウトカムはベースラインからの変化と改善者の割合として比較
 - 保存群は割付時をベースライン、手術群は手術直前をベースライン?
 - 測定日がズレた場合は、線形補完した平均値を使用
・解析モデルには欠測とアウトカムに関連する変数を投入
 - 複数測定の影響に変量効果モデルを使用

【結果と結論】 
・潜在適格者1991人中1244人がSPORTに参加
 - 743人が前向きコホートに参加(手術希望521人/保存希望222人)
・参加者の97%が1回は測定でき、解析に組み入れ
 ‐ 各測定時点での測定割合は82‐89%
・手術⇄保存のクロスオーバーで結局手術528人/保存191人
・保存治療の内訳以下
 - 指導92%、NSAIDs58%、麻薬系35%、PT43%、ブロック38%
・手術合併症は以下
 - 輸血2人、硬膜損傷2%、再手術1年7%2年9%(半分が再発で)
・主な効果は以下(手術 vs 保存)
 BP変化量 (3M) 40.9 vs 26.0 差14.8 (10.8, 18.9)
 PF変化量 (3M) 40.7 vs 25.3 差15.4 (11.6, 19.2)
 ODI変化量(3M) -36.1 vs -20.9 差 -15.2 (-18.5, -11.8)
 BP変化量 (2Y) 42.6 vs 32.4 差10.2 (5.9, 14.5)
 PF変化量 (2Y) 43.9 vs 31.9 差12.0 (7.9, 16.1)
 ODI変化量(2Y) -37.6 vs -24.2 差 -13.4 (-17.0, -9.7)

このように、手術群の方が改善がよかった!が、自己申告のアウトカムなので解釈は慎重に行うべきであるとの結論。

<向学のためにlimitationのまとめ>
・適格基準が厳しいので、結局一般化に支障
 - 6W我慢できなかった人が含まれていない
 - でもガイドラインでは6W待つわけだから影響は小さいでしょ
・保存的加療は多様すぎる
 - 一部無効だったり有害だった場合に手術の効果を誇張
 - でもだいたいどの治療も効果あるとされている
・欠測が14~18%あった
 - でも複数の感度解析で結果が覆らないことが示された
・盲検化されていないうえに、アウトカムが自己申告
 - 後療法への意欲、期待、変化への気づきなどが結果を修飾
・すべての患者や術者の要因を考慮することは不可能
 - 未測定交絡がどの程度結果に影響しているかは不明

【批判的吟味】★★★★★
どこかでSPORTの枝研究読んで、もう一つだな…と思っていたのですが、本家はすごかったです。もう15年前にこんなに丁寧な研究がされていたんですね、そりゃJAMAに載るのも納得。RCTと対じゃなく、この研究1本だけなら無理だったでしょうけど。思いつくLimitationは全部書かれていたし、突っ込み思いつきません。お手本にするには交絡や欠測の取り扱いの詳細がなかったのが物足りなかったのは残念ですが、プロトコル論文には書いてるのかな。てかプロトコル論文がSpineに載るってすごい…

【コメント】
PubMedでSPORTをひくと100以上の文献が…これだけ大きな研究に関われたら臨床家/研究者として一生の仕事になりますね。それにしても「非盲検化」「アウトカム自己申告」は相当手ごわい問題…結局1/3が研究参加自体を拒否しているので、選択バイアスも結構ありそうだし。でもこれ以上どうしたらいいんでしょうか…バイアスも含めて治療効果!患者良くなってたらそれでいいじゃん!という考えもあるでしょう。でももし結果がバイアスからきてるなら、手術してなくても良くなってたじゃん!ということになるんですよね。手術の純粋な効果をみるのはホントに難しい…(てかシャム手術しないと無理?)

最近なかなか専門分野(脊椎)の論文を読んでいなかったので、一念発起して読みます。久しぶりにEAをcheckすると、何とNEJMから腰椎椎間板ヘルニア(LDH)の論文が…これは読まないとタイヘンです。「難しすぎる」といくつかご指摘ありちょっと分量減らしめで。

Surgery versus Conservative Care for Persistent Sciatica Lasting 4 to 12 Months.

研究疑問  :亜急性期のLDHは手術した方がよい?
研究デザイン:RCT
セッティング:カナダ単施設(2010~2016年)

P 4-12ヶ月下肢痛が続くL4/5かL5/Sの内側LDH 128人
I  顕微鏡下摘出術
C 保存的加療
O 主要 :下肢痛VAS(6M時点)
副次 :ODI、腰・下肢痛、QOL(6W, 3M, 6M, 1Y)、合併症

急性期のLDHを手術するかはよく議論されてるけど、亜急性期のLDHをどうしたらいいかは分かっていない。のでRCTしました!という研究。

【方法の概略】
・ほか包含基準は18-60歳
 除外基準は罹患高位の手術歴、すでにブロックやリハビリ施行中
・保存群は投薬、リハビリ、ブロック
 6ヶ月たてば手術OK
・労災の有無で層別した置換ブロック法で割付
・サンプルサイズはODI(MCID10)で計算
・解析の詳細は(難しいので)割愛
 対象はITT集団の模様

【結果と結論】
・連続したLDH790人のうち適格者は168人で参加は128人(76%)
・ランダム割付から手術までは3.1W
・手術群の8人(13%)は結局手術せず
・保存群の2人は6M以内に他院で手術
 -最終的に22人(34%)が手術
下肢痛VAS(6M時点)は手術群 2.8 vs 保存群 5.2
 調整平均差は2.4 (1.4, 3.4; p<0.001)
・他のアウトカムも同様の傾向、有害事象も差はなさそう

というわけで亜急性期のヘルニアも(6ヶ月followの時点では)手術>保存との結論。

【批判的吟味】★★★★★
解析はちょっとややこしいものの、全体的な構成はシンプルでわかりやすい研究。質が高くないと間違ってもNEJMには載らないので、細かな批評はさておきRoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 Some concerns 
3. アウトカムの追跡 Low risk
4. 評価者の盲検化 High risk
5. 選択的な報告 Low risk

RCTの質としてはちょっと微妙です。手術⇄保存のクロスオーバーは少ないですが、「2.割付の盲検化」はできないのでSome concerns。アウトカムがVASなので、手術してよかった!というプラセボ効果などがバイアスになり「4.評価者の盲検化」はHigh risk。シャム手術が倫理的に許されない以上、この研究疑問では質の高いRCTは無理なので仕方なしでしょう。プラセボ効果も含めても患者さんがhappyになるなら、術者としては問題ない!?

【コメント】
たしか4年前に変性すべりに固定 vs 除圧のRCTがNEJMに載りましたが、このような一見アタリマエの研究疑問が実は解明されていないという。脊椎外科には多くのcommon diseaseが登場しますが、実はエビデンスは決定的に足りません。このような状況下に自分にできることは何だろうと自問自答の毎日…

ちょっと順序が逆ですが、先日読んだ第三相試験に先駆けた、2018JNS-Spine掲載の第二/三相試験の紹介。こちらは浜松医大の松山教授を筆頭とした、やはり錚々たるメンバー。批評するのはおこがましいですが、大事な分野なので勉強がてらやってみます。

A multicenter, randomized, double-blind, dose-finding study of condoliase in patients with lumbar disc herniation.

研究疑問  :腰椎椎間板ヘルニア(LDH)にコンドリアーゼ注は効果あるか?
研究デザイン:RCT
セッティング:日本38施設

P 20-70歳の靭帯穿破していないLDH(L4/5かL5/S) 195人
I 1 コンドリアーゼ1.25U/ml+生食4ml 49人 
I 2 コンドリアーゼ2.5U/ml+生食4ml 50人 
I 3 コンドリアーゼ5U/ml+生食4ml 49人 
C ブラセボ(生食1.2ml) 47人
O 主要 :下肢痛VASの変化量(13W)
   副次 :自覚  ~腰痛VAS変化量、ODI、SF-36
    他覚  ~神経所見(SLR、筋力、深部腱反射)
       画像  ~椎間板/ヘルニア量、椎間高(中央判定)
安全性:有害事象、vital sign、血液検査、画像パラメータ
   動態 :6,24,48h,1,2,6,13Wでの採血など
      ←お恥ずかしながら理解不能

保存加療がもうひとつのLDHの治療は現状手術一択である。経皮内視鏡などの低侵襲手術が発展しつつあるものの、習得に時間がかかるし、専用機材は高価でアクセスが悪い。コンドリアーゼ注は保存と手術の中間に位置し、第一相試験が成功した。ので第二相試験(適量をきめる)を行いました!という研究。

【方法の詳細】
・ほか包含基準は
 - SLR陽性、≥6Wの保存加療後、VAS≥50mm or 最悪の痛みが≥7W持続
・除外基準は
 - アレルギー、多発例、腰椎手術歴、3W≥の神経根ブロック、
   進行性の神経症状、腰椎疾患、妊婦 or 授乳中、BMI≥35、労災、不安定性あり
・1.25, 2.5, 5とプラセボに最小化ランダム割付
・調査者、患者、画像判定医は盲検化、薬物動態も未開示
・各群椎間板穿刺は脊椎認定医が覚醒下に施行
・対象者は2泊入院し、1,2,4,6,13,26,39,52W外来follow
・担当医の裁量で保存加療を追加
・神経根ブロック/手術の追加は脱落扱い
・VASは観察日の7D前から連続して測定(し平均値を使用?)
・画像パラメータ(安全性)の判断基準は
 - 椎間減高≥30%、局所後弯≥5°、すべり≥3㎜、Modic変性、椎間板変性
・サンプルサイズは差21mm、検出力90%で計算
・解析はFAS対象?に共分散分析、共変量の選択にはステップワイズ法を使用
・欠測値はLOCFで補完

【結果と結論】
結果は13W時点での下肢痛VASはC群 -31.7mm vs I1群 -46.7mm vs I2群 -41.1mm vs I3群 -47.6mmで、プラセボとの比較で有意差がついたのはI1群とI3群だった。その他の結果は以下のとおり。

・用量反応関係は肯定されず(P=0.14)
・I群はみなSLR、ODI、SF-36 (PCS)においても優位
・すべての患者の全ての時点で血漿コンドリアーゼの検出はなし
・血清ケラタン硫酸濃度はI群全てにおいて6H~6W上昇
・深刻な合併症はI群 3人とC群 2人
Modic1型変性と椎間減高が観察され、用量反応関係がみられた

これらの結果を受けて、効果は用量でかわらないため、有害事象を考えると1.25Uが最適でしょうとの結論。ちなみに脱落はC群 6人 (13%)、I群あわせて12人 (8%)。

【批判的吟味】★★★★
やっぱり私などが文句つける点は殆どないキレイな研究です。ただ、気になる点は第三相試験とほぼ同じです(詳細は前記事ご参照を)。印象としては第三相試験よりカチッとしています。

① リクルート期間、セッティングの詳細がない
② サンプルサイズの設定が微妙
③ 欠測をLOCFで埋めるのは微妙(欠測数も不明)
④ 脱落者の影響が考慮されていない
⑤ 追加の保存治療の情報がない

あとRCTなのに共変量を調整するとランダム割付が崩れてしまうのでは?という疑義も。共変量をステップワイズで選択するのも微妙な気がします(データからではなく、臨床的に選択する方が妥当かと)。まぁ生物統計家の先生の入った仕事なので、これでいいのかな。ちなみにRoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 Low risk
3. アウトカムの追跡 High risk
4. 評価者の盲検化 Low risk
5. 選択的な報告 Some concerns

と、RCTとしての質はまぁまぁになるでしょうか。一応脱落だけでも5%以上あるので、それらの影響を考慮した解析(たとえば複数の感度解析で結果が一貫していることを示す)などで改善の余地がありりそうです。Clinical.trialsへの登録情報はアクセスできますが、プロトコル自体にアクセスできないもの勿体ない限り。もう一手間かけれたのなら、BMJ openなどにプロトコル論文が欲しかったところ。私はまだcochrane review完遂していない素人なので、ガチのreviewerがみたらもう少し厳しい評価になるかも。

【コメント】
もう承認されているわけですし、そりゃ効果はありそうですよね。あとはサンプルサイズによる制限で有害事象については殆ど未知であり、現状では決して安全と言い切れるものではないので、多数の患者を長く追跡した有害事象の評価を待たなければなりません。また、セッティングをかえた長期予後の評価もみてみたいものです。質の高いエビデンスの蓄積により「選ばれた勇者」だけではなく「リアルワールドの住人」にも効果的であることがわかって、治療選択肢として普及することに期待します。あくまで始まり、本当の闘いはここからでしょう。ってお前誰やねん!っていう声はさておき、この試験たちのメタアナリシス誰かしないんかな。アプライしたいところですが、どう考えても時間がとれないなぁ…

ヘルニコアのセミナー案内をいくつか頂きました。2年ほど臨床最前線を離れ浦島太郎でしたので、これを機にヘルニコアの勉強をしてみます。まずは2018Spine掲載の本邦発第三相試験から。防衛医大の千葉教授はじめ錚々たるメンバーで、私なんかが批評するのはおこがましいですが、スタンスだけは(あまり)曲げずにやってみます。

Condoliase for the Treatment of Lumbar Disc Herniation: A Randomized Controlled Trial.

研究疑問  :腰椎椎間板ヘルニア(LDH)にコンドリアーゼ注は効果あるか?
研究デザイン:RCT
セッティング:日本35施設

P 20-70歳の靭帯穿破していないLDH(L4/5かL5/S) 166人
I  コンドリアーゼ1.25U/ml+生食1.2ml 84人 
C ブラセボ(生食1.2ml) 82人
O 主要 :下肢痛VASの変化量(13W)
   副次 :自覚  ~下肢痛VAS50%≤達成割合、腰痛VAS変化量、ODI、SF-36
    他覚  ~神経所見(SLR、筋力、深部腱反射)
       画像  ~椎間板/ヘルニア量、椎間高(中央判定)
安全性:有害事象、vital sign、血液検査、画像パラメータ

1982年にFDAに承認されたキモパパインはそれなりに効果的で、13.5万人に使用された。しかしアナフィラキシー、神経損傷や椎間板炎などの合併症により1999年に使用禁止になってしまった。新たに開発されたコンドリアーゼは基質特異性が高く、すでに第二相試験で安全性と適量が検証できたので、第三相試験をしました!というもの。

【方法の詳細】
・ほか包含基準は
 - SLR陽性、≥6Wの保存加療後、VAS≥50mm or 最悪の痛みが≥7W持続
・除外基準は
 - 多発例、腰椎手術歴、3W≥の神経根ブロック、
   進行性の神経症状、腰椎疾患、妊婦 or 授乳中、BMI≥35、労災
・罹患期間、痛みの強度で層別した最小化ランダム割付(1:1)
・13W時点で割付結果を開封(誰に?)
・各群椎間板穿刺は脊椎認定医が覚醒下に施行
・対象者は1泊入院し、1,2,4,6,13,26,39,52W外来follow
・担当医の裁量で保存加療を追加
・神経根ブロック/手術の追加は脱落扱い
・画像パラメータ(安全性)の判断基準は
 - 椎間減高≥30%、局所後弯≥5°、すべり≥3㎜、Modic変性、椎間板変性
・サンプルサイズは差15mm、検出力90%で計算
・解析はFAS対象?に連続値は共分散分析、二値はロジスティック回帰
・共変量はベースライン値と罹患期間
・欠測値はLOCFで補完

【結果と結論】
結果は13W時点での下肢痛VASはI群 -49.5mm vs C群 -34.3mmで差 -15.2mm (-24.2, -6.2) と有意差がつき、LDHの薬物治療として斬新で強力ですとの結論。その他の結果は以下のとおり。

・13W追跡はI群 76人 (93.8%)、C群 70人 (86.4%)
・13W下肢痛VAS 50%≤達成割合はI群 72% vs C群 51%
・I群はSLR、ODI、SF-36 (PCS)においても優位
・手術への移行はI群 9.8% vs C群 9.9%
・深刻な合併症はI群 4人 (4.9%) とC群 6人 (7.4%)
・Modic変性はI群 25人 (30.5%) vs C群 14人 (17.3%) 
・椎間減高≥30%はI群 7人 (8.5%) でC群にはなし

【批判的吟味】★★★★
国家的臨床試験だし、私などが文句つける点は殆どありません。ただ強いていうなら、以下いくつか気になる点はあります。

① リクルート期間、セッティングの詳細、包含可能性あり人数がない
② サンプルサイズの設定が微妙
③ 欠測をLOCFで埋めるのは微妙(欠測数も不明)
④ 脱落者の影響が考慮されていない
⑤ 追加の保存治療の情報がない

①は結果を私の目の前の患者に当てはめれるかどうか?を判断するために、すなわち「204 Patients assessed for eligibility」がどういう集団なのか知るために是非欲しい情報です。35施設が大学病院なのか、場末の臨床病院なのかで患者の特徴も異なります。②は検出したい差「15mm」は「Based on the result of the previous study」ではなくて、どういう臨床的意義があるかに依るべきです。③はLOCFを使う「最終観察時のアウトカムがずっと維持される」という仮定は明らかに満たされないので、別の方法を採用すべきです。④は数は少ないながら「効果ないから何かしてくれ」と逃げちゃった人の影響があるので、感度解析で結果の頑健性を示す方がよいかと。⑤はまぁ盲検化がしっかりできていれば影響は少なそうですが、アウトカムに大きく関わる共介入なので明示されるべきでしょう。RoB2

1. 割付けの隠蔽化 Low risk
2. 割付けの盲検化 Low risk
3. アウトカムの追跡 High risk
4. 評価者の盲検化 Low risk
5. 選択的な報告 Some concerns

と、RCTとしての質はまぁまぁになるでしょうか…。やっぱり欠測の情報や、脱落の影響についての考慮で改善の余地がありそう。あと一応13WまではKey codesは壊されなかったとの記載あり、盲検化は担保されていたと判断しました。が、誰を、どこまで、どう盲検化したかの詳細は欲しかったです。ただでさえ捏造問題で日本発研究の信用下がっているので、「どっちの割付だったと思います?」と参加者と調査者に確認してみてもよかった。ちゃんとしたプロトコルがあるはずなのに、アクセス方法が本文中にないのも勿体ないです(上記指摘の多くはカバーできたはず)。プロトコル段階で公表されていないと、そもそもトップジャーナルでは査読にすら回りません。

【コメント】
とりあえず靭帯穿破してなくてジワジワ長引きそうなLDHに勧めてみてもいいかな、と思える結果ではありました。ただ手間を減らしたい(早く進めたい)など理由があったのでしょうが、より頑健なデザインにできたこと考えると非常に勿体ないです。内容としてはJBJSはおろか、BMJとかもっと上の雑誌も目指せたんじゃないでしょうか。追跡調査が必須ですが、ホントにいい治療なら世界的に普及させたいですよね。じゃーお前仕切れや!と言われると全然無理ですけど...まずは自施設のプライベートRCTで経験積まなきゃ...

本日はBJJから、2019年4月にノルウェーからの報告です。北欧は国家規模のレジストリが整備されていて、実態をしらべる記述研究は頭2つくらい抜けています。

Complications, reoperations, readmissions, and length of hospital stay in 34 639 surgical cases of lumbar disc herniation.

研究疑問  :腰椎椎間板ヘルニア(LDH)手術の合併症の実態は?
研究デザイン:記述研究
セッティング:ノルウェーの公的病院全体

P 腰椎椎間板ヘルニア手術(約35000件)
O 手術合併症、3ヶ月以内の再手術・再入院

 *期間は1999年から2013年
 *手術合併症は「硬膜損傷」「感染」「血腫」「その他」「麻酔関連」「創離開」「ショック」「創内遺残物」と定義(発生頻度もこの順)

術後の合併症、リオペ、再入院とか入院期間の実態がわかれば、医療の質やコストを考えることにも役立つし、医者と患者が治療方針を話し合う際にも役に立つので、LDH摘出術の実態について国家規模のデータベースで調べてみました!という論文。結果は手術合併症が合計2.7%、再手術が2.1%、再入院が2.4%などなど、あわせて6.7%に何かが起こっていたというもので、思ったより安全だねという結論。

【批判的吟味】★★★★
記述研究なので、兎に角どれだけ研究対象に代表性があるかが全てなのですが、その点国家規模のデータベースを用いたこの研究は強いです。具体的には1999~2007年の手術ほぼ全部、2007~2013年の手術の8割が網羅されています。ほぼ悉皆調査になっていますので、リアルワールドにおける診療の実態を表す結果といえるでしょう。あくまでアウトカムの測定は「データベース上に病名がついているか」ですので、実は合併症があるのに病名つけなかったり、逆に保険病名的に大げさに病名をつけたり、誤分類の可能性はあります。またノルウェー人と日本人は人種の差がありますし、医療事情や診療の質の差もあるでしょうから、直接的に結果を解釈することもできません。

【コメント】
ホントは日本も電子カルテに記録された医療情報が、マイナンバーをもとに、他の様々なデータ(死亡小票など)と紐づけされて一気にデータベース研究が進むはずだったのですが、なんせ電子カルテが群雄割拠状態マイナンバーも尻すぼみで、悲しいかな江戸時代のままです。国民皆保険制度もほぼ破綻していますし(TVでは放送されませんよ、大事になるので)、どうなる日本、、

このページのトップヘ