お手伝いしているCochrane Reviewが(筆頭著者の頑張りで)佳境にさしかかっています。包含した研究からデータを抽出したら、統合(メタアナリシス:MA)して効果の推定値を示します。ただそのMAの結果がどれだけエビデンス総体に迫っているか?の評価がないと、読者がどれだけその結果を信頼していいかピンときません。

GRADEシステムはMcMaster大学のGuyatt先生が率いるGrading of Recommendations Assessment, Deveropment and Evaluation (GRADE) working groupが開発した、「エビデンス総体としての確実性」の尺度です。各アウトカムについてMAの結果得られた効果の推定値が、どれだけエビデンス総体として信頼できそうか?を示します。具体的には以下の4グレードになります(私の意訳です)。

エビデンス総体に…
 High :近いという確信がある 
 Moderate :近そう、でも大きく異なる可能性も
 Low :大きく異なるかも、信頼性に限界
 Very low :大きく異なるだろう、信頼できない

このグレードをだす過程で、以下の研究の型+8要因を評価します。研究の型によってスタート時点のグレードが決まり、そこから減点5項目と加点3項目で加減して最終グレードが決まります。

 ① 研究デザイン RCT のみ →Highスタート
非RCTあり →Lowスタート
 ② Risk of Bias 深刻-1、非常に深刻-2
 ③ 非一貫性 深刻-1、非常に深刻-2
 ④ 非直接性 深刻-1、非常に深刻-2
 ⑤ 不精確 深刻-1、非常に深刻-2
 ⑥ 出版バイアス ありそう-1、明らか-2
 ⑦ 効果量 効果大+1、効果絶大+2 
 ⑧ 用量反応性 あり+1
 ⑨ 交絡因子が 効果ありの結果を弱める+1
効果なしの結果を弱める+1

ただし、単純に加減するわけではなく、重複減点しないように総合的に判断しなければなりません。ちょっとモヤっとした尺度ですし、ある程度EBMに長じた人がつけないとわけわからなくなってしまいそう。そして何人かで個別に判定して、結果を合議で決めないといけないでしょう。

各下位項目の判断基準ですが、① RoBはCochraneのRoBツールと連動して判定する模様。②は「点推定値のばらつき」「信頼区間の重なり具合」「I²値」「異質性検定p値」で総合的に判定。⑦は相対リスク<0.5 or 2<で効果大、<0.2 or 5<で効果絶大…その他細かな判定基準がある程度決まっていますが、詳細は成書ご参照を。難しい英語の教科書読まなくても、日本語の教科書が出ています。でも日本語だけど難しい…そしてこの本高っ…