二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ:疾患別エビデンス > 椎体骨折(OVF)

先日介入の効果をみる前向きコホート研究(非RCT)を読みましたが、引き続きお手本となるコホート研究を読んでみます。ある特徴が将来のアウトカムと関連するか?という予後をみる研究については、前向きコホート研究が最強になります。まぜなら「ある特徴」は介入と違ってランダム割付することができず、RCTが不可能だからです。それこそ研究デザイン力が結果の精度に大きく影響する臨床疑問になります。やぱりお手本なんで、JAMA様から…

Long-term risk of incident vertebral fractures


研究疑問 :低骨密度(BMD)は将来の骨折と関連するか?
研究デザイン :前向きコホート
セッティング :Study of Osteoporotic Fractures(SOF)
*1986年に開始、米4施設で構成

P 高齢白人女性(平均年齢69歳)
E   既存骨折あり
C 既存骨折なし
O 新規骨折

P 高齢白人女性(平均年齢69歳)
E   低BMD(単位は1SD)
C BMD正常
O 新規骨折

以前に低BMDと椎体骨折の関連、および既存椎体骨折と続発椎体骨折との関連について報告したが、平均3.7年のfollowと短かった。ので、15年以上観察した報告をまとめてみますとの研究。

【方法】
・細かな研究計画は先行研究参照
 - 黒人女性はリスクが低いので含んでいない
・研究参加9704人
 - 第8回調査対象は4284人(44%)
 - 実際に受診したのは2797人(29%)
 - うちX線が撮れて、読めて、ベースラインX線もある2680人(28%)を解析
・X線ではT4-L4の前方・中央・後方椎体高を測定
 - まず盲検化された3人でスクリーニング
 - 各X線で一番変形が強そうな椎体を、正常/微妙/たぶん骨折に評価
 - たぶん骨折だけ細かく測定
 - ランダムサンプル503人で試し測定
 -感度は「既存骨折」「新規骨折」それぞれ97%, 100%
・「既往骨折」の判定には前方/後方、中央/後方、後方/尾側椎体の後方を使用
 - いずれかが3SD未満の場合に「既存骨折」
・「新規骨折」の判定には前方、中央、後方を使用
 - いずれかが20%もしくは4mm減高で「新規骨折」
・BMDは踵骨、橈骨、大腿骨、大腿骨頸部、腰椎で測定

<解析>
・まず本研究対象2680人と非対称7024の背景を比較
・骨折時期はわからないので(Coxではなく)ロジスティック回帰
 - まず年齢と施設で調整
 - 続いてさらに骨粗鬆症加療、非脊椎骨折既往、BMI、喫煙習慣で調整
・ 年齢/施設モデルでROC解析(各BMD部位で)
 - さらに70歳以上/既存骨折で層化した解析も
・BMDと既存骨折で絶対リスクを算出

【主な結果と結論】 
・487(18.2%)に新規椎体骨折が発生
 - 既存骨折ありは163/394(41.4%)、なしは324/2286(14.2%)
 - 既存骨折のオッズ比は4.21 (3.33, 5.34)
・低BMD(1SD単位)も新規骨折の発生と関連
 - (大腿骨で)オッズ比 1.78 (1.58, 2.00)
・大腿骨BMD‐2.5SD未満+既存骨折ありの新規骨折発生は56%
 - 一方BMD正常で既存骨折は9%

既存骨折ありと低BMDはいずれも独立した新規骨折のリスク因子であり、既存骨折があり更に低BMDなら注意!との結論。

<Strength / limitationのまとめ>
・地域住民を対象とし、サンプルサイズが多く、15年目のX線を用いている。
・高齢白人女性以外(他の人種や男性)に結果が当てはまるかは不明
・生存者の多くが再診したが、再診しなかった人よりベースラインが健康だった
 - ので、骨折リスクを過小評価している
・腰椎と大腿骨のBMDはベースラインの2年後に測定
 - でもベースラインで測定した踵骨や橈骨とかわらない結果

【批判的吟味】★★★★★
アメリカやっぱ規模がすごいです。この研究幾らかかってるんだろ…ここまでやれば観察研究でもJAMAに載るんですね。解析は(私でもわかるような)シンプルなものですが、当時は旧き良き時代だったから?ツッコむところがあるとすれば、観察研究なんで交絡の調整は十分か?というところ。パーキンソン病、ステロイドはじめとした二次性骨粗鬆症…骨折と関連する疾患は相当たくさんあります。ただ、だからといってこの研究の結果が覆るとは思えませんし、結果に異論を唱える人はいないでしょう。ちなみにこれを「高齢日本人」で調べるのも重要かも(日本人だけ対象でJAMAに載るかはわかりませんが…)。

【コメント】
PubMedでSOFをひくと約30の文献が…やっぱり大きなコホート研究は枝論文が結構でますね。かく言う私も福島医大/京大のコホート研究の脛をかじりまくらせていただいています。「予後をみる研究」はRCTできない分、コホート研究頑張れば最善のエビデンスが出せますので、それこそ脊椎絡みの多目的コホート研究、多施設でできないかなぁ…「介入の効果をみる研究」のための疾患特異的レジストリも必要ですけど。

11月は一大イベントがあり、とくに前半はかかりきりで論文を読んでいませんでした。その期間に相当たまってきたEAを渉猟してみます。と、先日塩漬けにしたと述べたテーマに近いシステマティック・レビュー(SR)がSpineに出ている…これがしっかりしたSRなら、別のテーマを探さなきゃ(いずれにしろするのは大分先ですけど)…ということでサラッと読んでみます。

Orthosis in Thoracolumbar Fractures: A Systematic Review and Meta-analysis of Randomized Controlled Trials

臨床疑問  :外傷性胸腰椎骨折に対するコルセットの効果は?
研究デザイン:Systematic Review
セッティング:全世界(~2019.6月)

P 急性期の外傷性胸腰椎骨折(合計267人)
I コルセット
C なし
O 後弯(6M/12M)、減高・VAS(6M)、入院期間
*Oに記載したのはメタアナリシス(MA)のみ記載
*Pubmed、Scopus、Cochrane Centralをkey word検索
*RCTのみを包含
*Risk of biasも評価
*PROSPEROに事前登録
*PRISMAに準拠

神経障害がない外傷性胸腰椎骨折にはコルセットが使われるが、そのRisk/Benefitはよくわかっていない。既存のSRは骨粗鬆症を対象にしたものや、2014年に2つのRCTを包含したものに限定されているので、改めてSRしてみました!という研究。結果は…

・重複を除いた1209研究が対象
 - Ti/Abスクリーニングで30研究
 - 本文checkで8研究(3つは学会報告)
 - 同一セッティングを除き最終的に5研究を包含
・後弯、減高、VASに差はなし
・1研究で12MのODI改善を報告(ただし24Mでは差なし)
・入院期間差はコルセット群が3日 (95%CI 1-6)むしろ長い

で、コルセットは保存的加療からの追加効果はない。この結果はガイドラインや政策に反映されるべきとの結論。

【批判的吟味】★★★
Spineでのエビデンスレベルは3と控えめですし、全体的に最低限のルールは守ってありキレイで読みやすい研究でした。これ以上改善する点もパッと思いつきませんが、気になる点を強いて挙げるなら

・検索式が物足りない(作り込んでも不変でしょうけど)
・全体的につかみや方法が浅い(深くやっても結果は不変でしょうけど)
・MAがMAX3研究267人で、「効果ない」とか結論づけるのは飛躍し過ぎ
 - 結論は「効果あるかどうかわからない」
・RoB評価が甘そう(細かなcheckはしてませんが)
・GRADE評価がない
・Benefitはわかったけど、Riskは?

そもそも外傷性の(骨粗鬆症じゃない)胸腰椎骨折でコルセットするかしないか迷う患者が対象なので、対象は結構限られるし、切実ネタか?というとちょっと微妙な気が。「成人」「急性期」「外傷性」「胸腰椎骨折」でくくってますが、T10 とL5では全然別の疾患ですし、骨密度や脊柱バランスなど非常に多様な領域。そもそもエビデンス不足が一目瞭然です。なので、できるできないは別としてやらなきゃいけないのはSRじゃなくて、質の高いRCTか悉皆レジストリ研究でしょう。

【コメント】
この完成度(決して低くはないです)なら、まだ「塩漬け研究」を復活させる余地はありそう。ただ、やらなきゃいけないのはSRじゃなくて、RCTか悉皆レジストリ研究なんですよね。自分にブーメランですが、色々な意味で敷居が高いなぁ…まずは実績と実力をつけるところから早急に…

椎体形成術(VP)について文献検索をしていて、またVPをディスる文献をみつけてしまったので読んでみます。著者はやっぱり反対派のTopで、NEJMでRCTやったりCochraneとそのup-dateしたこの界隈では最も高名なBuchbinder(バックビンダー?)先生で、2019.5月のコメント。雑誌はInternal Medicine Journalというオーストラリア誌(2019IF1.7)。

Why we should stop performing vertebroplasties for osteoporotic spinal fractures

<まずはじめに>
・1980年代後半にVPがはじまった
・まず観察研究で除痛効果(VAS2.5)と安全性(合併症1%)が報告された
・ラザロ徴候(脳死者が手足を動かす)なみの奇跡かよ!ともてはやされた
  - のでエビデンスに基づかないまま急速に普及した 

<最初のRCT>
・導入20年(2009)にやっと最初のRCT 
 - NEJMに2本 ←1本はバックビンダ―先生発
・ 結果はどちらも「効果なし」
 - 効果はプラセボ効果、自然経過、平均への回帰、患者の期待によるもの

<最初のエビデンスへの反応>
・反応は賛否両論
 - 地域によってVPを保険から外したり、そのまま継続したり
・米国内でも整形外科学会は強く反対した一方で、強く推奨する他団体もあり
 - 結果として放射線科では増加し、他科では減少
・2008-2014の期間で、VPは半減
 - でもRCTもないKyphoplasty(KP)が一旦減って徐々に増加
・VP/KPの75%は低所得者層に施行されていた

<業界が国民を欺いた>
・Web上には怪しい情報が満載
 - 放射線科学会HPですら「60-90%の患者に効果あり、合併症は5%以下」
・「ある業者」はWikipediaをよりVP/KP推しに変えようとして失敗
 - 「ある業者」は団体と結託してVP/KPの啓蒙活動を現在も続けている

<続く3つのRCTもコケた>
・NEJMのRCTをサブ解析して、発症早期なら効果あるかも?との結果
 - そして<8W、<6W、<9Wに限定した3つのRCTが施行された
 - 2つの結果は「無効」、1つは「有効」
 - でも「有効」だったRCTは過大評価のバイアスリスクあり
・5つのRCTを中心としたCochrane reviewではかなり強い結果
 - 痛み、機能障害、QOL、治療成功した実感いずれにおいてもVPは「効果なし」

<サブグループにおける仮説を掘り下げる>
・<3Wに限定した解析もしてみたけど、やっぱり「効果なし」
 - だから「発症早期なら効果がある」との仮説には疑問
・VPは早くした方がいい!との考えには反対
 - 多くの骨折は発症早期に改善するので、自然経過を「VPの効果」と誤解
・エビデンス総体として効果はほぼ0
 - 一部の患者に著効と主張するなら、反面多くの患者に逆効果ということ

<なんでここまでおかしな状況になったか>
・臨床経験や観察研究における誤解、「VPの奇跡」には理由がある
 - 盲検化なし、自然経過が良好、アウトカム自己評価の場合25%の効果増
 - 非盲検化試験の結果から増加分を引くと、盲検化試験と完全一致
 - 医者は全員このバイアスを理解しなさいよ!

<先ず隗より始めよ>
・VPには感染、肋骨骨折、続発骨折、セメント塞栓、麻痺や死亡のリスクがある
・6つのRCTを統合した結果も続発骨折のリスクを示唆
 - VP vs プラセボで48/418 vs 31/422、リスク比1.29 (0.46, 3.62)
・VPをやめさせるために医者は
 - 患者とともにrisk-benefitが釣り合わないことを知るべき
 - 患者に事実を伝え、エビデンスに基づいた意思決定を行わせるべき
 - 患者にインターネットの情報や「啓蒙活動」を過信するなと警告すべき

【コメント】
読んでいてかなり興味深い記載がたくさんあったので、思わずほぼ全訳してしまいました…確かにバックビンダ―先生の言っていることも一理あるなぁ。調べてみると、世界大学ランキングTop100に入るMonash UniversityのClinical Epidemiologyの教授(2007年~)と。これは相当な強敵…先生とその同胞が恐らくTop journalの審査側に入るので、非の打ちどころがない研究をしないと反対意見を公開することすらできないでしょう。

臨床医の立場からすると、VP(日本ではBKP)がやはり「奇跡」を起こすことは絶対あります。先日もふさぎ込んで食事も入らず寝たきりの90歳の女性が、BKP翌日からモリモリ食事して歩行練習開始できました。最初はもうこのまま…とすら思った超高齢者が、自宅に帰る準備しているわけです。バックビンダー先生はこっち側(臨床家)ではなく、そっち側(EBM)の人です。臨床経験を妄信せず、謙虚にならなければならないのは間違いない!のは正にその通りですが、EBMと臨床には少なからず乖離があることを強く感じます。

こっち側の人間には、「そっち側の意見を真摯に受け止める」こと、「臨床経験を謙虚にふりかえる」ことが求められます。その上で実感する「奇跡」をどのように形にしていくか…は私のようなこっち側とそっち側の間をウロウロする人間に与えられた命題のような気がしてきました。がんばらなくっちゃ!にしてもメド〇ロ相当嫌われてんなぁ…結構えげつない商売してるんだろうな…

少し抱え込んでいるプロジェクトもひと段落したので、今のうちにSpineの論文を読んでおきます。方法論的にお手本になる論文は残念ながら少ないので、ネタ重視で。

Conservative Versus Operative Treatment of Stable Thoracolumbar Burst Fractures in Neurologically Intact Patients: Is There Any Difference Regarding the Clinical and Radiographic Outcomes?

研究疑問  :神経症状のない胸腰椎移行部破裂骨折は手術すべきか?
研究デザイン:過去起点コホート
セッティング:イスタンブール大学?2010-2016年

P 18-60歳のT10-L2のA3/A4骨折(神経症状なし)45人
E 手術あり 21人
C  なし(TLSO装具+安静) 24人
O  最終受診時の画像パラメータ・VAS・ODI・JOA・SF-36、入院期間
*除外基準は下肢骨折、2W以上後の手術など
*全例から同意取得
*割付方法は?
*解析はとにかく検定
*背景情報は年齢、性別、follow期間のみ

胸腰椎移行部破裂骨折の半分は神経症状アリ、半分はナシと言われている。ナシのAO分類のA3やA4に手術すべきかはわかっていないので、自験例を調べてみました!という研究。結果のまとめは

・局所後弯 E  4° vsC 11°
・後弯の喪失 E  2°  vs C  4°
・前方椎体高の喪失 E13% vs C18%
・後方椎体高の喪失 E  3% vs C  8%
・JOA、ODI、VAS、SF-36、入院期間は有意差なし

で、手術すれば画像パラメータは良いけど、臨床成績に有意差はでなかったとの結論。

【批判的吟味】★★
やりたいことはすごく共感できるのですが、エビデンスとしては残念ながらほぼ0です。手術の効果をみるにはRCT一択ですが、実現可能性を考えると観察研究もやむなし。ただ観察研究するなら相当しっかりやらないとエビデンスとしては発信できません。大きな弱点は以下のとおり。

・適応交絡を全く考慮していない
・Table 1.が少なすぎ(対象が骨粗鬆症じゃなくても、せめて骨密度は必要)
・多重検定
・アウトカム測定のタイミングが揃っていない
・研究内容伝えずに同意とるのは反則
・もう「有意差」という表現はやめよう

【コメント】
やっぱり害はないけど、益もないというか…So What?というか…臨床成績を真摯に見直すのは大切なことです。ただ折角やるならちゃんとやらないと勿体ないし、対象となる患者に失礼。無理して弱い研究採用しなきゃいいのに…自分のは採用して欲しいですけど。

さて、臨床研究ではいろいろな差を調べるわけですが、そのものさし(尺度)も様々です。腰痛による機能障害の尺度はRoland-Morris Disability Questionnaire(RDQ)が有名です。そして差があることがわかった際には、その差が重要かどうか?を判断する目安がその尺度ごとにあり、Minimal Clinical Important Difference(MCID)と称します。

いま椎体骨折についてのいくつかの前向き研究をデザインしていて、早ければ4月にも開始します。そこで椎体骨折患者にRDQを使った際のMCIDについて勉強。MCIDをどう決めるか?などは不勉強(だから内容がズレてたらホントすいません)ですが、ドンピシャ(ぽい)論文がSpine Jに!あったのでとりあえず読んでみます。何を勉強したらいいかの道標になることを期待。

Item response theory analysis to evaluate reliability and minimal clinically important change of the Roland-Morris Disability Questionnaire in patients with severe disability due to back pain from vertebral compression fractures

研究疑問  :重度腰痛患者におけるRDQの妥当性の検証
研究デザイン:過去起点コホート
セッティング:米・英・豪11施設の研究121人+米研究からの選抜93人
*椎体形成術が施行された対象
*ベースラインと、術後1Mの値を使用

Introduction
・RDQ(24項目)から5つ抜いて4つ加えたRDQ-23が開発された
・RDQは~中等度の腰痛を対象に開発され、重度に使えるか微妙
・とくに低値域と高値域で誤差が大きい
・ので、椎体骨折におけるRDQ-23の妥当性とMCIDを検証

Methods
<Item response theory (IRT)>
 - 特定集団に不変の項目や、被験者と項目のモデリングについての共通指標を示す?
 - 1パラメータロジスティックモデル(1PL)は項目の困難度(b)を示す(-2~2)
 - 2PLはbと弁別能(a)のモデル(aは項目と潜在特性 [θ] の関連を示す)
・Dimensionality
 - 項目と個人の分析に一次元IRTを使用
 - 一次元性の検討には因子分析を用いる
 - 因子分析における第1因子の優位性を
   the latent variable exploratory factor analyses with the principal axes method
   を用いて決定することで評価
 - 第1因子によって生じる分散(因子固有値:eigenvalue)と第2因子のそれの比率、
   第1因子による多様性?として示す
・Choice and overall fit of item response model
 - 1PLと2PLの選択には、RMSEA統計量を使用
・Person and item parameters
 - 理解不能
・Reliability of the RDQ-23 in light of test information
 - ある集団のθは平均0/SD1に変換される
 - 項目情報関数(IIF)は、その項目が提供する情報が最大となるθを示し、
   項目の有用性を示す強力なツールである
 - 重度腰痛集団における尺度の有用性は、古典的テスト理論(CTT)における…
   以下理解不能

<Classification of patients who achieved MCID>
 - 以下2つの手法で調査
・MCID derived from classical distribution-based methods
 - CTTに基づく
 - ベースライン値の0.5SDと1測定の標準誤差(SEM)を用いてMCIDを算出
 - 1.96SEM、smallest real difference (SRD)、modified reliable change index (RCIindiv)
   でも算出...
   ここから理解不能
・MCID based on IRT statistics
 - SEMによるMCID計算は「測定誤差がスケール全体で均一」という無理な仮定をおく
 - IRTはこの問題を回避するSE(^θ)という統計量を提供する...
   以下読むことを断念
 - 古典的手法と、IRTを用いた手法の一致度はκ係数で評価
   0.74以上は誤差小、0.40-0.74は許容範囲
・MCID based on published literature
 - 多くの先行研究でのMCIDは5

Resultsの抜粋(MCIDに関する部分)
・MCID derived from classical distribution-based methods
 - 0.5SD法および1SEM法 MCID=2
 - 1.96SEM法 MCID=4
 - SRD法 MCID=5
・MCID based on IRT statistic
 - 1SEM法と1SE(^θ) κ=0.93
 - 1.96SEM法と1.96SE(^θ) κ=0.89
 - SRD法と2.77SE(^θ) κ=0.71 
 *IRTを用いたMCIDは集団特性によって変化

Discussionの抜粋
・RDQ-23はより軽度の集団ほど鋭敏に測定する
・IRTを用いたMCIDは、重度になるほど大きくなる
・より重度の集団を標的としたRDQの改訂版があるとよい

Conclusions
・中等度の腰痛を検出する目的の項目を、重度の項目に置換したRDQがあるとよい
・RDQを用いて「意味ある変化」を解釈する際は、算出法の選択に要注意

【コメント】
大変恐縮ですが、手に負えませんでした...成書も参考に勉強しながら読んだのですが、真面目にIRT勉強しないと読めません。何となくわかったのは

 ・MCIDの求め方は2通り(分布から算出する方法と、外部尺度を用いる方法) 
 ・RDQは重度腰痛の測定尺度としては微妙かも 
 ・RDQのMCIDは使う対象によって異なるかも 
 ・だいたい5に設定したら間違いなさそう

といったところでしょうか。先日読んだRDQを主要アウトカムにしたBMJのRCTの研究対象集団では平均値が13点くらいだったので、今研究を企画している集団の平均値がそのくらいなら許してもらえるかなぁ...だいたいRCTとかに入っている椎体骨折集団のベースラインRDQは20弱くらいなのでちょっと微妙かも。でも予後良好例も入るので平均値もうちょっと低くなる?とりあえずパイロット調査してデザイン固めるのが良さそうですね。前向き研究、失敗が許されないので敷居が高い...てかSpine Jの読者(主に脊椎外科医)でこの論文細読できた人どのくらいいるんだろう...査読で回ってきたら吐くなぁ…

このページのトップヘ