二択で迷ったらアグレッシブな方を選べ

本ブログのコンセプトは 「外科系臨床医に臨床研究について知ってもらう」です。自分で勉強したことを備忘録として気ままに書いていますので、情報の真偽については責任を負いかねます。また専門性が高い方にとっては内容が浅い点、分量が多くて読み辛い点もご了承くださいませ。

カテゴリ: 臨床研究

イロイロ相談をいただいたり、和英問わず査読をする際に、研究対象者数Nを方法の項に書いてあることが多い(というか殆どそう)です。私はそれは修正した方がいいと思うのですが、なぜなのかを整理しておきます。

【Methodsに書くこと】
臨床研究とは、とある臨床疑問CQを解決しよう!と、データ集めて解析する研究です。そしてMethodsは「どうやってそのCQを解明するか」を詳述する項です。要因EとアウトカムOの関連を検証する研究を例に挙げますと、Methodsにはどういうセッティングで、どういう基準で対象者(P)を集めて、どうOやE/Cを定義・測定して、E/CにおけるOの差をどのように解析して示すか、欠測にどう対処するか、などを記します。当然研究の質を評価するに十分な内容であり、第三者が自分もやってみよう!と思ったときに別のセッティングで同様の研究が再現できるに足る内容であり、その他の無駄は省いて整理された内容である必要があります。

ここでPについて必要な情報は「どのような包含基準で対象者を選抜」して、「どのような除外基準で枝打ち」してPを決めるかであり、実数は不要です。ただし当然不可欠な情報ですから、Resultsの最初に記して、何ならFlow chartでわかりやすくするべきです。

【源泉集団と研究集団のちがい】
また、ちょっとひねくれた見方をすると、Methodsに対象者の実数を記すということは、自分が興味あるのは手元にあるデータだけですよ!と宣言するようなものです。研究が終わったら論文化を目指すわけですから、当然そのCQは著者の目の前の患者だけではなく、似たような境遇の他の医師や患者にもあてはめたいはずです。以前記した研究対象についての記事の図を再掲します。

選択バイアスについて
C:源泉集団(研究結果を当てはめたい母集団)
B:標的集団(研究でアクセス可能な集団)
A:研究集団(実際に解析した集団)

手元にあるデータAを解析して知りたいのは、Cにおける真実です。色々な統計解析はAがCの代表であることを大前提に、AからCを想像する手法です。ので、実際にみているのはAを通じたCです。なので、Bが何人でAは何人でした!とMethodsで宣言することには違和感が。MethodsにはCをみるためにこんなBを準備します(セッティングや期間)という情報を書いて、Resultsに結果としてBが何人でAは何人でした(参加拒否者や欠測の情報)を示すのがいいと思います。

【まとめ】
とまぁ理想を言えばキリがないのですが、NをMethods→Resultsに移動するくらい大した手間じゃないし、少しでも自分の研究の見栄えを良くするためには、一考の余地があるかと思います。こういう小知恵でメッキを貼り貼りするのも臨床研究力!?

ふつう臨床医が臨床研究をしようとしたら、その是非はさておき、独学で四苦八苦しながら以下のような成長過程をとるのではないでしょうか?私はそうでした。

 1. 症例報告
 2. カイ二乗検定、Mann-WhitneyのU検定、Studentのt検定 
 3. ちょっと凝った検定
 4. 多変量解析(ロジスティック回帰)

実はそこから先が果てしないのですが涙、とりあえず4.までたどり着いたときにまずぶつかる壁が「どの変数をモデルに組み込むか」もしくは「結果をどう解釈したらいいか」なんじゃないかなと思います(私はそうでした)。その答えはケースバイケースなので簡単には答えられませんが、大切なのはその多変量解析の目的は何か?じゃないかなと思います。具体的にいうと、探索したいのか?検証したいのか?ということです。

【探索的研究】
ある有害アウトカムOを減らしたい!と一念発起したとします。するとまず最初に考えるのが、どの要因EがOを引き起こしているか?です。Eがわかれば、EをどうにかすればOが減らせそうですから。その際にどうやってEを探すかというと

 1)既存のエビデンスからもってくる
 2)専門家で合議する
 3)自分で探す

になります。2)は文献の網羅的検索を行い、質の評価をし、E候補を選抜すると。でも悲しいかなまず足りないので、1)で臨床経験豊富な人たちが集まって合議する。それで結論が出たらそれでOKなのですが、それでも足りなければ3)するしかない。これが即ち探索的研究で、多変量解析でE候補を選抜するのです。多変量解析では、E候補どうしのかかわりも考慮したうえで(ここが単変量解析との決定的な差)、各E候補とOとの関連の強さが数字で出ます。そこで強そうな因子を選抜し、Eを探索するわけです。この場合多変量解析に投入する変数は、1)2)である程度選抜したE候補になります。そして、得られた結果からは強いことは言えず、EはOと関連する(かもしれないけどまだわからない)といったニュアンスになるでしょう。

【検証的研究】
Eがみつかったら、次は本当にOと関連があるかの検証にうつります。検証とは、考え得る交絡因子の影響を除外する作業で、すなわち交絡の調整が目的になります。ここでも多変量解析が活躍します。この場合多変量解析に投入する変数は交絡因子候補になり、やはり上記1)2)をやって、更には因果グラフを描いたりして決めます。あくまでEとOの関連を歪める因子を探すわけで、探索的研究におけるE候補と全く同じにはなり得ません。結局交絡を調整しつくすことはできないので、結局強いことは言えないものの、EとOは関連する(かもしれない)くらいのことは言えるでしょう。

【まとめ】
いきなりこんなこと独学で考える猛者はなかなかいないと思います。が、研究に芯を入れるためには大切なこと。こういった研究の土台となるような考え方が独学じゃなく、無理ない範囲で学べる機会が増えないと、真の意味でEBMは発展しないでしょう。どうしたら普及するんだろう…その前にもっと自分の実力つけなきゃただのオオカミ少年!?

はじめて多施設を訪問してデータ収集した臨床予測モデル(CPM)研究の解析を進めています。CPM妥当性の記事でご紹介したとおり、予測モデルは開発したあと妥当性の検証が必須。全然関係ない集団で外的妥当性を検証するのがBestですが、それだけで1つの研究にしてもいいくらいタイヘン。実際のところは手元のサンプルを分けて内的妥当性を検証するSplit validationが手の届く範囲で最善でしょう。しかし本研究ではサンプルサイズが400前後と小さいため(それでも収集に100時間要しましたが涙)、Bootstrap Validationを試みることに。Split validationよりいいとの噂もあるし、できると大分解析の幅が広がるはず。下に貼り付けている「黄色い本」を勉強した内容を、備忘録も兼ねてちょっとまとめてみます。

Bootstrap varidationでは、Bootstrap法で仮想サンプルを作成し、そのサンプルを使ってモデルの開発と性能評価を繰り返し、要約し、最終的にOptimism-Corrected Performance(OCP)を算出します。その具体的な手順は

1.まずもとサンプル(S)を用いてCPMを開発し、開発したCPMのSにおける性能(Apparent performance: AP)を算出する。
2.Bootstrap法でBootstrap sample(BS)を作成する。
3.BSを用いて、1.と全く同じ方法で新たなCPM(BCPM)を開発する。BCPMのBSにおける性能(Bootstrap performance: BP)を算出する。
4.BCPMのSにおける性能(Test performance: TP)を算出する。
5.Optimism(O)=BP-TPを算出する。
6.1-4を十分(200回以上)繰り返し、Oの精確な要約値を算出する。
7.OCP=AP-Oを算出する。
 
のようです。OCPはOptimismを考慮した分、APよりずっと保守的で妥当な数値になると。これは頑張るしかありません。実は3まではもうSTATAでコード書けたのですが、4.が難しい…「STATAでもちゃんとできる」というハナシも耳にしたので、今からネット渉猟しつつ、試行錯誤してみます。こんなん解析の専門家がやってくれるなら無駄な時間使わなくていいのに…臨床医がしなきゃいけない日本の研究環境、どうかしてるぜ怒

CPM研究のバイブル「黄色い本」です。

いま、以前からご相談いただいていたケースシリーズを(も…)やっています。観察研究の結果は(あまり)信頼できないですし、無理にP値計算したりするより、真摯なケースシリーズの方が正しいんじゃないか?と思う今日この頃。ただ、ケースシリーズはなかなか強いJournalには載らないし、お手本が少ないです。症例報告なら割と知られたガイドラインがありますが、ケースシリーズには…というわけで、無理やりフレームが似た先行研究を持ってきて読んでみることに。由緒正しきJNSの2015年論文です。内容はどうでもいいのでロジック重視で。

Utility of Dynamic Computed Tomography Angiography in the Preoperative Evaluation of Skull Base Tumors

研究疑問  :頭蓋底腫瘍手術に動的CTAは有用か?
研究デザイン:ケースシリーズ
セッティング:ハーバード大学病院?

P 頭蓋底腫瘍手術前に動的CTA/CTVを撮った64人
E 動的CTA/CTV撮影 
O 主要動静脈の描出
術式への影響

頭蓋体腫瘍の手術は大変だから、術前計画が重要。でも従来の画像評価では不十分だったので動的CTA/CTVはどうかな?と調べてみましたという研究。結果動的CTA/CTVはMRIよりいいし、血管造影より低リスクだし、ナビにも流用できるのでいいでしょ!という結論。
 
<方法の流れ>
・対象患者の説明
・撮影方法
・解析方法
 - 主要な動静脈が確認できるかを2人の外科医が判定
 - さらに、検査前後で手術戦略がかわったか検討
・線量の測定方法

<結果の流れ>
・背景情報の記述
 - 年齢、性別、病理の要約のみ
・血管の描出
 - なんと表とビデオ!(My PCでは見れないけど…)
 - Labbeは殆どみえるし、ほか重要な静脈も結構みえる 
・術式への影響
 - 25/64例 (39 %)が術式変更
 - 25例全員の詳細をTable 3に
・線量
 - 自験例の標準的CTAとの比較
・症例提示
 - 代表例3例(主に画像)

<考察の概略>
・頭蓋体腫瘍の手術では静脈が大事
・血管の特定について
 - CTAは優れているが限界があった
 - 動的CTAが登場したが、腫瘍手術に用いたdataはなし
・術式への影響について
 - 1/3以上の術式に影響
 - 1例だけ術中所見で変更(術前にわからなかった)
 - ルーチンで撮っているため選択バイアスは小さい
・ 線量について
 - ちょっとだけ線量がふえる
 - 線量を押さえる工夫が必要
 - 血管造影は侵襲があるし、術者の被ばくもあり微妙

【批判的吟味】★★★
なるほど!無理やりP値出したり、κ出したりしなくても単に症例報告して写真みせたり、割合示すだけでJNSに載るんですね。解析は血管が映ってるかどうか2人で数えただけと。Table 1も非常にシンプル。いくつか物足りないと感じるのは

・セッティングとその説明がない
・全体の手術数や、除外数の説明がない
・倫理審査の記載がない
・線量を研究外の自験例dataと比較
・研究と関係ないことを結語に書いている

などでしょうか。カテーテルより安全!と結語に書くのは無茶ですが、大きくケチつけるところもないし、臨床に役立ちそうな論文でした。

【コメント】
全体のフレームワークは非常に参考になりました。早速目の前の研究に活かして、ロジック組み立て直しです。それにしても、需要考えたらケースシリーズの指南書というか、ガイドラインあった方が便利ですよね。誰か作らないかな…

よくメンター先生方から「これって関係みれてないでしょ?関連でしょ?」といった旨ご指摘を受け、関係と関連の違いそんなに大事?とチンプンカンプンだったことがありました。実はその研究の根幹に関わる重要な違い…と思うようになったのはつい最近。あくまで現時点での私的な認識ですが、整理しておきます。

【関係と関連のちがい】

 「関係」とは「因果関係」Causal relationship
 「関連」とはAssociation、何なら「相関」Correlation

を指します。「因果関係」とは、AによってBが生じる、すなわちAが原因でBが結果であることを指します。一方、「関連」はAとBには関連があるけれども、Aが原因でBが結果なのか、それともBが原因でAが結果なのかわかりません。言い方をかえると、AとB因果関係があるためには関連は必要(関連は因果関係の必要条件)ですが、関連があるからといって因果関係があるかはわかりません(関連は因果関係の十分条件ではない)。

【因果関係を示すには】
因果関係を示すのは非常に難しく、

 1.AとBに関連がある
 2.Aが先でBが後(時間的順序がある)
 3.交絡因子の影響がすべて除外できる

ことが必要です。とくに臨床研究で3.を証明するのはほぼ不可能。よくデザインされたRCTであれば、同じようなRCTをひたすら繰り返した平均としては理論上3.が言えますが、それ以外では不可能です。そのため、因果推論 causal inferenceという学問があって、偉い先生方ができるだけ因果関係に迫るために日々頭を悩ませていると。私のような駆け出しの疫学者もどきには遠い世界…(避けることはできませんが)

【関連性を示すには】
ちなみに関連性を検証するのもそう簡単ではなく、交絡因子の影響を考慮することが必須です。さもなくば、AとBに関連がありそうにみえても、AもBも実は結果で、共通の原因Cによって見せかけの関連が示されているだけの可能性があります。何でもかんでも変数をモデルに入れて、強い因子を選抜する探索的研究では関連性について強いことは言えません。

【まとめ】
関係>>関連であり、臨床研究(とくに観察研究)で「AとBの関係が示された」とか「AによってBが生じることがわかった」と結論するのは避けた方が無難です。また、探索的な研究(とくに交絡を全く考慮しない単変量解析)で「AとBに関連がある」と断定するのも✕。せいぜい「…かもしれない」とお茶を濁すのが妥当でしょう。勉強するほどつらい現実に直面する、ドMな世界…
 

このページのトップヘ