Confounding Variable 交絡因子
Confounding VariableとはConfounding variableのConfoundingとは”混乱させる”という意味であるが、日本語では交絡因子という。絡み合っている因子という意味であるから日本語としても適切な訳かと思う。
さて、交絡因子を定義すると:
「予測因子と関連を持ち、同時に結果因子の原因ともなる因子」
「予測因子以外の、結果に影響を与える恐れのある因子」
「予測因子Predictor variableと結果因子Outcome variable」の両方に関連を持つ因子」
といろいろな表現がされている。なぜ交絡因子が問題になるのか
臨床研究では観察的研究によって「何が原因でその結果が起きたのか」という因果関係Cause-effect Relationshipを明らかにしたい場合が多い。つまり、多くの臨床研究はケース・コントロー試験(Case-control study)かコホート研究(Cohort study)で、いくつかの予測因子Predictor variableと結果因子Outcome variableの関連Associationを明らかにし、さらに予測因子が原因となっているのか単なる関連なのかを明らかにして、真の原因を知りたいがために行われている。その場合、測定された予測因子の内、因子AがYという結果の原因であるという結論を出す際に、もし、予測因子の中の因子Bが因子Aと結果Yの両方に影響を与えている場合には、因子AがYの原因であるというのは難しくなってしまう。また、因子Aが因子Bの影響を受けている場合に因子Aが結果Yにどれくらい影響を与えているのかも不明瞭になってしまう。場合によっては、真の原因はBであるかもしれない。また、研究をデザインする段階で考慮に入れなかった、未知の因子が交絡を引き起こしている場合もありうる。つまり、因子Bが研究に含まれていない場合には誤った結論を導き出してしまうことになる。したがって、因果関係の推論にあたって、交絡はバイアスと共に問題を引き起こし、得られた結論の正当性を損なうことになってしまうということを良く認識しておく必要がある。
例:
コーヒー摂取と心筋梗塞の関係を明らかにしたい場合:
タバコを吸う人はコーヒーも良く飲むという関係があった場合には、喫煙は心筋梗塞の原因の一つであるから、コーヒー摂取と心筋梗塞との間に見かけ上関連があるかのような結果が出てしまう。この例では喫煙がコーヒー摂取と心筋梗塞の両者、すなわち予測因子と結果因子の両方に影響を与えている交絡因子になる。したがって、調査項目の予測因子に喫煙が含まれていなかった場合には、コーヒー摂取が心筋梗塞の原因になるという誤った結論を引き出すことになってしまう。交絡の影響を排除するには
研究デザインの段階:
ケース・コントロール研究の場合にはケース群とコントロール群、コホート研究の場合には暴露群と非暴露群の対象者を選択する場合に「対象者の限定Specification」と「マッチングMatching」という方法によって交絡因子のレベルを等しくするという方法がある。いずれもサンプリングを工夫する方法である。対象者の限定とは対象の取り込み基準Inclusion criteriaで交絡因子を持った例を除くようにする方法である。例えば、上記の例では喫煙の交絡を避けるために非喫煙者だけで調査するという方法である。
限定の問題点:しかし、対象者が限定されるために問題が起きる可能性がある。例えば、上の例で非喫煙者だけを対象にコーヒー摂取と心筋梗塞の関係を調べた場合に、喫煙者ではコーヒーが心筋梗塞の原因になっているかもしれない。(つまり、コーヒーの心筋梗塞に対する影響が喫煙者と非喫煙者で異なる場合。これをコーヒーと喫煙の相互作用Interaction=交互作用という。)
マッチングとは、個々のケースに対して交絡因子のレベルの等しいコントロールを選択するという方法である。例えば、ケース・コントロール研究で心筋梗塞患者でタバコを一日20本吸う人がいたら、それに対してコントロールとして心筋梗塞でない者で同じくタバコを一日20本吸う人を選択するという方法である。この方法はケース・コントロール研究で良く用いられる方法で、Age-sex-matched groupをコントロールにした、というような研究である。
マッチングの問題点:対照群が数多く必要になる。また、因子AとBの関係によってはマッチングが有害な場合もある。例えば、上の例で、もしコーヒー摂取が喫煙の原因となる場合には、喫煙でマッチングすると、コーヒーと心筋梗塞の関係が隠れてしまう。もし、因子A,Bともに第三の因子Xの影響を受けているような場合や、因子Bによって因子Aが影響を受けているような場合には、因子Bによって、マッチングすることは効果的である。
データ解析の段階:
層化Stratification:
上記のごとき比較する群間で交絡因子のレベルをそろえて解析する方法で、交絡因子のレベルで亜群に分けてそれぞれの亜群=層=Strataの間で比較する方法。ただし、層別化する因子が多い場合には一つの層に含まれる対象者数が少なすぎて解析が出来なくなってしまう可能性があることと、逆に層の数が少なすぎると交絡の除去が不十分になるという欠点がある。補正Adjustment:
統計学的に補正Adjustmentを行うことによって交絡をコントロールする方法は、因子間の関係に数学的なモデルを想定し、それに基づいて交絡の影響を除去する。つまり、因子Aが因子Bの影響を受けているとした場合、因子Aの値の因子Bによって規定されている部分を差し引くことによって、因子Bの影響を除去するといった方法である。実は多変量解析Multivariate analysisの大きな利点の一つが、多くの交絡因子の影響を同時に補正することが出来るという点にある。ただし、そのモデルがその研究データに適合するかどうかに注意しなければならない。
因果関係を積極的に言うためには
1.研究デザインが異なるほかの研究の結果と一致する:Consistency of association.
2.P値が小さく関連が強い。Strength of association :一般的に、交絡による見かけ上の関連は間接的な関係であるため、関連が低い。
3.量‐反応関係が認められる。Dose-response relationship :例えばタバコの本数が多いほど心筋梗塞のリスクが高くなる関係があるような場合。
4.生物学的妥当性がある。Biological plausibility
これらの条件が満たされるほどより強い証拠と考えられる。
(文献:スティーブン・B・ハリー、スティーブン・R・カミングス編著:医学的研究のデザイン:研究の質を高める疫学的アプローチ。(木原正博監訳、現代疫学研究会訳)。医学書院MYW、1997年。)
[Return to Medical Statistics] [Return to Techniques in Hepatology] [Return to Home Page]