研究デザイン Study Design

何が問題なのか? Question:

日常の診療の中でよく分からないことに遭遇した際に、”何が問題なのか?”をよく考えることが重要である。出来るだけ明確な形にすること。問題を明確なものにしないと、その解決法も明確にすることは出来ない。問題を解決するために研究が行われるのであるから、解決しようとする問題が明確になっていないのでは良い研究をデザインすることも出来ないはずである。

なんとなく何かを調べてみようということでスタートするといろいろなエラーが紛れ込む確率が高くなり、得られた結果が間違っている可能性が高くなる。

ここで仮想研究をデザインしてみよう。

例:TTVは非A非B非C型肝炎の原因となるのか?

仮説を立てる。 Hypothesis:

その問題を解決するために仮説を設定する。この仮説が正しいかあるいは誤っているかによって、その問題が解決するように仮説を設定する。

例:TTVに感染すると非A非B非C型肝炎になる。

この仮説が正しいことを証明するためにはどうしたらいいかを考える。

1.健康でTTV陰性の人がTTVに感染した後TTV陽性となり肝炎を発症することを証明する。

*現実にこのような研究はボランティアを頼んだとしても非倫理的で実現はまったく不可能である。

2.非A非B非C型肝炎すなわちHAV, HBV, HCVがすべて陰性の肝炎の患者さんと対照群でTTV陽性率を比較する。

*これはケース・コントロール研究になる。倫理的にも問題無く、実行することも可能である。


以上の研究デザインのやりかたと対照的なやりかたはどうなるであろうか。

A, B, C型慢性肝炎、急性肝炎、その他いろいろな肝疾患の患者さんの血清が保存してあるのでTTVを検査してみよう、ということになるであろう。この場合には何をどのようにして解析しようとするのか、何を明らかにしたいのか、が漠然とした状態で研究がスタートすることになる。つまり何か大発見をしようとして、あまり準備せずあまり考えずに探検に乗り出そうとするようなものである。

もう少し深く考えてみよう。例えば、各種肝疾患でのTTVの陽性率は明らかになるが、それはどのような意味を持つのであろうか。診断に役立つ:どのような診断に役立つのか?またどのように診断に役立つのか?TTV陽性の感度は特異度はどうなるのか?

これに答えるのはなかなか難しいのではないか。


研究タイプは適切か? Study Type:

例:ケースコントロース研究

それではケース・コントロール研究がこの仮説を証明するのに適切かどうかを考えてみよう。

コホート研究であればTTVに感染した人とそうでない人で、その後肝炎を発症するかを観察することになるが、そもそも発症する前にTTVに感染することを発見することは不可能である。例えば、数千人の大学生を対象にして4ヶ月に1回規則的に採血して、TTVに感染した時点を捉えることが出来れば、このような研究も可能であるが、現実には非常に難しい。研究に協力してくれるかどうか難しい。従って、コホート研究はこの場合ほぼ不可能である。

A, B, C型肝炎ウイルスのいずれも検出されない肝炎は急性肝炎、慢性肝炎を問わず少ないことはすでに分かっているのであるから、もしTTVが肝炎を引き起こしているとしても症例は少ないと予想される。ケース・コントロール研究は特にそのような症例がまれな場合に適用される方法であるからこの研究には適切と考えられる。

ただし、TTVがその肝炎の原因であるということを証明するのはこれだけでは困難である。求めて得られるのはTTV陽性の場合と陰性の場合の非A非B非C型肝炎であることに対するオッズ比である。つまり、TTVが陽性の場合にA, B, C型肝炎でなくて、非A非B非C型肝炎である可能性がどれくらい高くなるかということを示す指標である。しかしここでよく考えてみると、A, B, C型肝炎ウイルスマーカーを調べれば同じことが分かるのだから、TTVが非A非B非C型肝炎のマーカーであるとしても、それはあまり意味が無いのではないかということになってしまう。

普通、新しい診断法が従来の診断法より優れているということを証明したい場合には、そもそも対象者の診断をどうやって付けるのかということが常に問題になる。実は、いわゆるその時点における"Gold Standard"によって診断された患者さんを対象者にするしかないのである。そして新しい診断法が従来の"Gold Standard"よりも優れているかどうかは、その研究が世に出て実際のフィールドで広く使われて初めて分かることなのである。

しかし、ここでは診断的価値を問題にしているのではなく、”TTVは非A非B非C型肝炎の原因となるのか?”を問題にしているのであるから、この研究がまったく意味が無いとは言えない、がしかしそれ程強い意味があるとも言えないのではないかということになってしまう。つまりTTVと非A非B非C型肝炎の関連を明らかにするだけであって、原因であるというところまで強く主張することは出来ないということである。

研究対象の選択法は? Inclusion and exclusion criteria:

ケース・コントロール研究ではいろいろなバイアスが入り込みやすいのが一番の欠点である。特に対照群をどのように選択するのかが一番の問題である。

自分の病院に来院した急性肝炎、慢性肝炎でA, B, C型肝炎ウイルスマーカーが陽性の群を対照群とし急性肝炎、慢性肝炎でこれらウイルスマーカーがすべて陰性の群を研究群とすることにする。

ここで急性肝炎、慢性肝炎の診断基準を決める。さらにA, B, C型肝炎ウイルスマーカーを何にするかと、どの時点で検査をするのかを決める。ここでは詳細は省略するがこれらによって、研究群と対照群のエントリー基準(inclusion and exclusion criteria)が決まる。バイアスを減らすための工夫は後で出てくる割付 Assignmentで考えることにする。

研究対象のサイズは? The size of the study group:

ここでケースコントロール研究における帰無仮説H0 hypothesisをまず作成する。先ほどの仮説は”TTVに感染すると非A非B非C型肝炎になる”というものであったから、これを統計学的な仮説に置き換える。すなわち、”非A非B非C型肝炎とそれ以外ではTTVの陽性率は同じである”すなわち”差が無い”という帰無仮説を立てることになる。別の言い方をすると”非A非B非C型肝炎とそれ以外ではTTV陽性率のオッズ比は1である”ということにもなる。

まずType Iのエラー、つまり母集団で有意差が無いのに有意差があるという結論を出してしまう、つまり間違って帰無仮説を棄却してしまう確率、これはαエラーとも言う、をいくつにするかを決める。ほとんどの研究はαエラーを0.05に設定する。言い換えると、差があるという結果が出た場合に、それが偶然起きた偏りによって、そうなる確率を最大で0.05(5%)まで受け入れるということになる。

次にType IIのエラー、つまり母集団で有意差があるのに有意差が無いという結論を出してしまう、つまり間違って帰無仮説を受け入れてしまう確率、これはβエラーとも言う、をいくつにするかを決める。これは0.05から0.4位に設定する研究が多い。ここでは0.1に設定することにする。また、(1 - βエラー)のことをパワーPowerという。したがって、この場合には0.9のパワーで差を検出できるようにするということになる。βエラーを0.1にするということは実際には差があるのにないという結論を出してしまう確率を0.1にするということである。

なぜ、αエラーとβエラーの水準を設定するのかといえば、必要な症例数を決めるためである。必要な症例数を決めるにはこれら2つの因子と、対照群におけるTTV陽性率と研究群におけるTTV陽性率がどれくらいかという予測値が必要になる。αエラーとβエラーを小さな値にするほど、そして両群の差が小さいほど、より多くの症例数が必要になる。これは直感的に理解されるであろう。実際には両群の陽性率を予測するのは難しいことが多く、予測が外れる可能性もあるので、途中で必要な症例数を修正する必要が出てくる可能性もある。

もう一つ決める必要がある項目は有意差検定の際のP値をtwo-tailedで算出するかone-tailedで算出するかということである。もし事前にどちらかの方が陽性率が高いということが予想されて、研究群が対照群より低いとか高いとか分かっているような場合にはone-tailedでよい。つまり、研究群が対照群より高いということだけを証明すればいいような場合にはone-tailedでよい。この例では高いか低いか予想がつかないのでtwo-tailedにせざるをえない。

2群で陽性率を比較する場合の症例数の計算式は以下の如くである。なおここでのz値はtwo-tailedの場合である:


(続く:1999.1.25森實敏夫)

文献:Dawson-Sauders B & Trapp RG: Basic and Clinical Biostatistics. 1994, Appleton & Lange, Norwalk, CT, USA. 



[Return to 臨床医学論文の読み方:チェックポイント]  [Return to 統計学講義]  [Return to Technique in Hepatology]  [Return to Home Page]