最近脊椎関係の論文をいくつかよんでみて、「いい研究」が少ない気がします。誤解を恐れずに申しますと、「ネタは面白いのに研究の質が低い」。論文書きあげて、投稿して、採択されるまでの苦労を厭わない猛者からの発信ですから、手抜きがあるわけではない。たぶん「臨床研究の基本」的なことが浸透していないだけでは、と思うのです。

というわけで「臨床研究で大事なこと」(独断)を述べてみようと思います。
まずは研究対象について。まず図を示します。

選択バイアスについて

C:源泉集団(研究結果を当てはめたい母集団)
B:標的集団(研究でアクセス可能な集団)
A:研究集団(実際に解析した集団)
*呼び方は僕が便宜上勝手につけています。

こんな感じの図を思い浮かべながら研究している人、ひいては論文を読んでいる人はどのくらいいるのでしょうか。ここ押さえておかないと研究に芯ができませんし、読み手もミスリーディングしてしまいます。

研究では、Aを解析した結果が示されます。ただ研究者を含め誰もAに興味があるわけではなく、興味があるのはCです。非現実的なCの解析のかわりに、Aを解析しているのです。なので大切なのは

 BがどれだけCの代表になっているか?
 AがどれだけBの代表になっているか?

です。下位集団が上位集団を代表するなら、下位集団で得られた結果を上位集団に当てはめることができます。もし下位集団が、上位集団からランダム抽出されていれば、その下位集団は上位集団の代表といえるでしょう。たとえば

C:2019.7.27時点での日本在住の日本国民全員
B:マイナンバーをもとにランダム抽出した1000人
A:研究参加に同意して、実際に調査できた人

この場合、BはCの代表になります。またもしBの全員が研究に参加し、A=BとなればAもCの代表になります。ではもし研究に参加したのが500人(半数が拒否)したらどうでしょう。この場合、「拒否」がランダムに発生するのであれば、AはBの代表です。逆に「拒否」に何らかの理由があれば、Aの結果をBに当てはめることは難しくなり、当然Aの結果をCに当てはめることも難しくなります。

せっかくなのでより現実的な例を(直近で紹介したPJFのリスク因子の論文をもとに)

C:Spine読者の目の前にいる手術したASD患者
B:多施設レジストリに参加したASD患者のうち、手術した人
A:1年以上followできて、自己免疫疾患などの並存症がなく、PJF以外で再手術になっていない(かつ欠測がない)人

まずBはCの代表になっているでしょうか?そもそものレジストリの登録者は、Cからランダム抽出した者ではありません。またレジストリへの参加を拒否した人は、理由なく拒否したのでしょうか?そんなはずはない。よって、Bの結果を直接Cに当てはめることはできず、解釈の際はBとCがどれだけ似ているかを想像する必要があります。

また、AはBの代表になっているでしょうか?1年followしていない人のなかには、単純に術後1年以内の人もいれば、脱落する人もいます。もし脱落理由が転居など、研究内容にあまり関係ないものなら問題はないでしょうが、死亡や、治療が嫌になって転医している場合は問題です。さらには、「PJF以外で再手術になった人」を除外してしまうと、AはどんどんBの代表からかけ離れていきます。

こう考えると、この例で研究結果をCに当てはめるのはちょっと難しい。これは結果が信頼できるかどうか(解析や測定が信頼できるか)とは全く別の問題です。この問題は最強の研究デザインであるRCTにもフツーに生じますし、誰もが大好きなP値が信用できるかに大きく関わります。
To be continued...