観察的研究の落とし穴
    Epidemiology Faces its Limits.

    Science 1995; 269:164-169.に”Epidemiology Faces Its Limits.というSpecial News Reportが発表されました。これは疫学的研究により、さまざまな因子がさまざまな疾患や健康状態に影響を与えることが発表されてきましたが、一方で相反する結果も発表されることが多いため、それがどうしてなのかを解説している記事です。多くの疫学者、統計学者にインタービューしてそれをまとめたものです。われわれが研究をデザインする際にも参考になる点が多いので簡単にその内容をまとめて紹介します。

    なぜ観察的研究なのか

    臨床研究では観察的研究によって「何が原因でその結果が起きたのか」という因果関係Cause-effect relationshipを明らかにしようとするわけであるが、 それはなぜかというと、まず倫理的な問題でRandomized Trialを行うことが不可能だからである。あるリスクファクターXが本当に疾患Yを引き起こすかどうかを知ろうとしたときに、健康な多数の人たちをそのリスクファクターに曝す群と、そうでない群にランダムに割り付けて疾患Yの発生を長期間観察することが出来れば一番信頼の出来る結果が得られるかもしれないが、それは不可能である。また、ファクターXだけが異なり、他の因子は同じになるようにすることも非常に難しい。さらに、極めて多数の対象者をフォローすることも難しいし、時間もかかる。薬剤の効果を判定する場合には、Randomized Trialを行わなければならないが、薬剤投与を受ける群と、受けない群あるいはプラセボ群にランダムに割り付けることはそれほど困難なことではないが、リスクファクターについての研究にはRandomized Trialは適用することは不可能なのである。

    そこで、Case-control StudyとCohort StudyというObservatinal Studyに頼らざるを得ない。が、そこにはさまざまな落とし穴がある。

    交絡因子 Confounders (Confounding Factors)

    交絡因子は研究をデザインする際に予測できるものもあるが、まったく予測できない場合もある。対象とする群に隠れていて、ある因子が本当に原因であるかのような関連を作り出してしまう。

    例1:タバコは多くの研究で交絡因子となる。例えばアルコールと癌の関係を研究しようとすると、飲酒する人は喫煙もする傾向があり、実際にはタバコが原因である場合でもアルコールと癌が関連があるという結果が得られてしまう。

    例2:コーヒーと膵癌の関連を報告した研究は、コーヒーをたくさん飲む人はタバコも吸うという関連があることを無視したために間違った結論を導き出してしまった。
     

    バイアス

    バイアスは研究デザインそのものに入り込んでいることが多い。ケースコントロール研究では適切な対照群を選択しなければならないが、この段階でバイアスが入り込みやすい。 何を比較対照とすべきかは理論的にも明確ではない事が多い。そして、もし理論的に適切な対照群を設定できたとしても、すべての人が喜んで対照群に入ってくれるわけではないので、研究に参加した人たちはそうでない人たちとすでに異なっている可能性がある。つまり、健康に自信のある人が主に参加しているかもしれない。

    例3:電磁波が小児白血病あるは脳腫瘍を引き起こすというケースコントロール研究が発表されたが、その研究では対照者を選ぶ際にランダム数字ダイアルという方法を用いた。ケースの患者の電話番号の最後の一桁をランダムに別の数字に変えてそこに電話をかけて依頼した。ところが、この方法では非常に社会経済状態の低い人たちが対照から排除される結果を招いた。つまり、貧しい人たちは昼間電話をかけた際に家にいない可能性が高く、研究に参加しようという気持ちがあまりなく、また留守番電話を持っている割合も低いからである。実際その後、別の研究グループが白血病と脳腫瘍は電磁波だけでなく、母乳栄養、母親の喫煙、交通事情と関係していることを明らかにした。これらの因子は貧困と関係がある因子である。対照群がより裕福な人たちに偏ってしまっていたために電磁波が原因であるという間違った結論を引き出すに至ってしまった。

    また、バイアスが認識されていても、それがどれくらい、どちらの方向に影響を与えるかが分からないことも多い。

    例4:乳房自己検診(Breast Self-Examination, BSE)は乳癌による死亡に対して軽度の利益があることを示した研究は、BSEを行う動機を対象者に尋ねなかったためにバイアスが入り込んでしまった。つまり、BSEをよく実行する人たちは、乳癌の家族歴がある事が多いのである。つまり、このバイアスはBSEの利益を少なくするように働いてしまう。乳癌の家族歴があり、乳癌になることを恐れている人たちはよくBSEをしているのだが、それでも乳癌になる人が多いので、BSEの効果を相殺するように研究結果に影響を与えてしまう。

    測定誤差

    また、リスクファクターの測定に曖昧さが伴う場合も多い。例えば、喫煙であれば何歳から始めて、一日何本吸うかはかなり正確に測定することが出来るが、ラドンに対する暴露などを測定するとなると、特に過去のある時期に起きた暴露を測定するとなると、これは不可能である。そして、多くの研究ではRecall Biasと呼ばれるバイアスが入り込む。質問票Questionnaireに書き込む際、あるいはインタービューを受けて答える際に、対象者は必ずしも正確に答えるとは限らない。例えば、脂肪の摂取量について調査を受ける際、やせた人は多目に答え、太った人は少な目に答える。患者さんは病気に罹ったので正確に答える傾向が高いが、突然対照者として聞かれた人は間違いを答える傾向があってもおかしくない。さらに、インタビューをする人はケースとコントロールを知らない状態でインタビューすることが難しいことが多く、ここでもバイアスが入り込む可能性がある。

    例5:経口避妊薬と乳癌の関係に関する研究では、ケースコントロール研究では関連あり、コホート研究では関連無し、という結果が出ている。ケースコントロール研究では乳癌患者は健常対照者に比べて経口避妊薬の使用についてより詳細に情報を提供する傾向にあり、コホート研究では質問表が大部になりやすいため記入するのが面倒になり、情報が正確さに欠ける傾向がある、と研究者たちはそれぞれ欠点を指摘しあっている。

    統計学による救済?

    交絡因子、バイアス、測定誤差はある程度は不可避であると言える。過去30年、モデルを作成することによって、バイアスや交絡因子を調整する統計学的手法が開発されてきた。しかし、元になるデータの質が低ければこれらの手法を活用しても問題は解決されない。これらの手法を用いても本来的に解決することが出来ないことを解決できると錯覚することも問題になる。例えば、統計学的に有意であるという結果を正しいと盲信するのは間違いである。95%信頼区間の算出も、サンプルが母集団からランダムに抽出されていることを前提としている。システマティックに入り込むエラーは無視されている、つまり、バイアスや交絡因子が統計学的な偏移を上回ることがありうる。

    95%の信頼区間は95%のチャンスで正しいが、5%のチャンスで間違っているかもしれない。真実を引き出せるような状況だったかどうかも考慮しなければならない。

    何を信じるべきか?

    ある研究者は言う:”研究が一つだけしか行われていなければ、95%信頼区間の下限が3倍以上であればまず正しいと信ずる。”別の研究者は言う:”下限が4倍以上あれば信じる。”

    New England Journal of MedicineのMarcia Angellは言う:”Relative Riskが3倍以上で、特に生物学的に意味があり、新しい発見であれば、アクセプトするかもしれない。”FDAの薬剤評価部長であるRobert Templeは言う:”もしRelative Riskが3あるいは4倍でなければ、それは忘れろ、である。”MacGill大学の疫学者であり、N Engl J Medの前統計学コンサルタントであるJohn Bailarは言う:”線を引くのは難しいが、もしRelative Riskが10倍で、それが再検されて同じ結果が出て、生物学的な支持もあり、例えば喫煙と肺癌の関係のような場合、強力な示唆を得たといえる。もし、1.5倍で、研究が1つしかなければ、もし非常に優れた研究であっても、あごを引っかいて多分ねと言うでしょう。”

    ある疫学者は言う:”増加するリスクが数十パーセントの場合、多くの別の研究で裏書きされれば、それは信じてもいいでしょう。それはメタ分析の拠り所です。つまり、多くの曖昧さの残る研究を寄せ集めて、同じ方向性が確認できれば。信じてもいいでしょう。”

    一方で軽度のリスクの増加に関しては疫学者たちの意見は分かれてしまう。例えば、飲酒と乳癌の関係や、経口避妊薬と乳癌の関係などについてである。

    しかし、異なる研究デザインで、異なる方法論で、異なる対象者で、なお同じ結果が出れば、それは説得力がある。もし同じデザインで同じ方法を用いると、内在するバイアスが常に邪魔をして、見かけ上同じ結果が出てしまう。

    そして、出版と言うフィルターを通してみると、Negative Studyは出版されないというバイアスがあることを忘れては行けない。研究費の獲得のためにも論文を出版しなければならないので、本来Negativeな因子にしがみついてしまうこともありうる。逆に測定誤差のために、本来のリスクが小さく算出されてしまう例もある。

    最後に

    以上ScienceのSpecial Reportに述べられていることをまとめて紹介したが、これを読んで悲観的になる必要はない。論文を読むとき、自分が研究をデザインするとき、自分がデータを解析するとき、ここに述べられていることを思い出すようにしよう。偏らず、冷静に、人の言うことも聞いて、自分を主張しすぎず、かといって主張すべきは主張して、真理に到達するよう努力しよう。

    (文献:Special News Report:Epidemiology Faces Its Limits. Science 1995; 269:164-169.)



    [Return to Medical Statistics] [Return to Techniques in Hepatology] [Return to Home Page]