臨床医学論文の読み方:チェックポイント
臨床医学論文は主に、1)コホート研究、2)ケースコントロール研究、3)無作為臨床試験(RCT; randomized clinical trial)に分類される。1)、2)は観察的研究であり、3)は実験的研究である。1)、3)は前向き研究であり、2)は後ろ向き研究である。1)と3)はある因子、それは危険因子であったり、治療・介入であったりするが、それを持つ者とそうでない者に割り付けて前向きに経過を追う。その場合、3)では割り付けをランダムに行うことを研究者がコントロールできるが、1)ではobserved assignmentといって、割付を研究者がコントロールすることは出来ない。2)もその点では1)と同じである。もし、動物実験であれば、危険因子への暴露を研究者がコントロールできるから、1)と3)は同じになる。ここにあげたのは論文を読んで評価するためのポイントであるが、同時に臨床研究をデザインするときのポイントでもある。
Assignment:
- Aims, hypothesis are well defined?
- The study type is appropriate to the questions?
- The population being studied, inclusion and exclusion criteria, how and where the samples being obtained?
- The size of the study group is adequate with sufficient statistical power?
Assessment:
- The assignment of patients to study and control group is proper?
- Selection bias? (Case-control or cohort study)
- Radomization and blind or masked assignment is maintained? (RCT; randomized clinical trial)
- The study and control groups are comparable with respects to characteristics other than the study factors? Confounding variables can affect the results?
- Matching or pairing is properly used?
Analysis:
- The assessment of outcome is properly performed in the study and the control groups?
- The measure of outcome is appropriate?
- The measure of outcome is accurate and precise? Reflecting the true measurement of the phenomenon?
- The measure of outcome is complete?
- The process of observation affect the outcome?
Interpretation:
- The analysis properly compares the outcomes in the study and control groups?
- The results are adjusted to take into account the effect of possible confounding variables?
- A statistical significance test is properly chosen to obtain the P value that the observed difference or association would occur if the null hypothesis were true?
- A point estimate and 95% confidence limit are provided?
- The number of hypotheses are taken into account?
- A Type I or Type II error can explain the study result?
Extrapolation:
- What conclusions can be drawn about the meaning of the study for those included in the investigation?
- The size of the difference or strength of the association is great enough to be useful or important?
- All three criteria of contributory cause are fulfilled?
- The investigators distinguish between contributory cause and necessary and sufficient cause?
- If all three criteria of contributory cause can not be fulfilled, are the ancillary criteria satisfied?
- The extrapolations to individuals, to groups, or to situations not like those included in the study are properly performed?
- The investigators consider both the relative risk and absolute risk when extrapolating to individuals? Alternatively, did the investigators calculate a number needed to treat?
- When extrapolating to new groups with the risk factor, the investigators take into account the attributable risk percentage?
- When extrapolating to the new groups composed of individuals with and without the risk factor, the authors take into account the population attributable risk percentage?
- The authors perform a linear extrapolation beyond the data?
- The authors consider differences between the study group and the target population?
基本事項:
1.Relative risks and odds ratios are the fundamental measures we use to quantitate the strength of an association between a risk factor and a disease. Relative risks and odds ratios are estimate or point estimate.
2.Confidence intervals give information about the likelihood of obtaining the observed results by chance and an estimation about the strength of the association to point estimates.
3.Contributory cause:
1) The characteristics referred to as the cause is associated with the disease (effect), that is, it occurs in the same individual as the disease more often than expected by chance alone.(1999.1.17 森實敏夫)
2) Cause has been shown to precede the effect, that is, the cause acts at a time before the disease has developed.
3) Altering only the cause has been shown to alter the probability of the effect (disease).Ancillary, adjunct, or supportive criteria for contributory cause:
1) Strength of association.
2) Consistency of association.
3) The biological plausibility.
4) A dose-response relationship.Comparison with necessary cause and sufficient cause:
Contributory cause, unlike necessary cause, does not require that all those who are free of the cause will be free of the effect.
参考文献:Riegelman RK and Hirsch RP: Studying a study and testing a test. (3rd edition), 1996, Lippincott Williams & Wilkins, Philadelphia, PA 19106, USA.
また、診断法に関する研究は3)横断的研究 Cross-sectional Studyが主たる研究となる。その時点で”Gold Standard"とされている診断法によって診断された患者さんとその疾患が無いと診断された対照群を対象として、新しい診断法を施行してその結果を比較することが行われる。新しい診断法の本当の価値はその後一般化されフィールドで用いられた結果によって評価されることになる。つまり、疾患群を設定する際に従来の”Gold Standard"とされている診断法によらざるをえないので、もし新しい診断法の方が感度が高く、特異性も高い場合にはそれまでの”Gold Standard"によって疾患群を設定することに意味が無くなってしまうからである。フィールドで使われるうちに新しい診断法が優れていることが明らかになれば、今度はそれが新しい”Gold Standard"になる。
さて、1)コホート研究、2)ケースコントロール研究、3)無作為臨床試験(RCT; randomized clinical trial)、3)横断的研究 Cross-sectional Studyに関する論文を批判的に評価する(Critical Appraisal) 際に、これらの研究はたとえ、一流誌に掲載されたものであっても、すべて何らかのバイアス=系統的なデータの偏り、が入っていることを前提にすべきだというのが正しい考え方である。これらのバイアスにはそれぞれの研究が正しく行われているかどうかとは別の次元の問題として起きることもあるので、すべての論文の評価の際に注意しなければいけない。
主なバイアスは:1) selection bias:実験群と対照群のリクルートで起きるバイアスである。患者さんが割り付けられる時点ではじめてどちらの群に割り付けられたのかが分かるようにすべきであり、割り付けをコントロールする人と担当医は別にすべきである。もし次の患者さんがどちらに割り付けられるかがあらかじめ分かっていると、それを変更したいような場合も起きてくる。
2) performance bias:患者さんに対するケアが違ってくることによるバイアスである。担当医は患者さんがどちらの群に属しているのか分からない状態で診るべきである。ケアに差が出ないようにすべきであるが、外部から見える手術の場合のように治療法によってはそれが不可能な場合もある。
3) attrition bias:ドロップアウトなどの対象者数の減少が偏って起きることによるバイアスである。たとえば、副作用が強いような場合に治療を完了した症例だけで解析すると正しくない結果を引き出すことになってしまう。ドロップアウトができるだけ少ないようにすべきである。
4) detection bias:アウトカムの検出に偏りが出ることによるバイアスである。実験群と対照群は同じようにフォローされるべきであり、担当医とは別の者が検査を行うとか、マスキングされた状態で結果を評価しなければならない。これらが主なバイアスである。(ここで述べているバイアスは特にRCTに関するものである。)
一流誌に掲載されたものであっても、たとえば大学病院で行われた研究であれば、対象患者の選択に最初からバイアスがかかっているであろうと考えるべきである。おそらく、重症な患者さんが多くなるであろうし、社会・経済的な階層も平均からずれていることが多いであろう。つまり、その研究自体は正しく行われたとしても、その結果を一般化する(Generalizability)際に問題が起きる可能性があるというイことである。すなわち、対象者が母集団を正しく反映しているかどうかと、得られたデータが真のデータにどれくらい近いかということを常に考える必要がある。たとえば、平均値であったり、率(著効率など)であったり、いわゆるPoint Estimatesが95%信頼区間を伴って、提示されるのであるが、それがいかに真の母集団の真の平均値、率に肉薄しているかを評価しなければならない。
その研究自体は正しく行われていてもそれがすべてではないという前提に立ち、なおかつ偶然に起きる偏りによる影響を考慮するとなると、真実を明らかにするにはそのテーマに関するすべての研究を集めて、先入観なく評価して、まとめる作業が必要になる。バイアス、偶然による偏り、そしてさらに、Publication Biasという問題もある。これらの問題をできるだけ少なくして、真実に近づこうとするためには、The Cochrane CollaborationやACP Journal Clubのような活動が必要になる。
Publication Biasとはポジティブな結果が出た場合には発表され、論文が書かれて投稿され、またアクセプトされやすく、掲載されやすいが、ネガティブな結果が出た場合には発表もされなかったり、投稿してもアクセプトされなかったりするために起きるバイアスである。つまり、有意差が出たという論文をみたときに、もしかすると有意差が出なかった論文が闇に葬られているかもしれないということを考える必要があるということである。B型慢性肝炎のインターフェロン28日間連日投与に関する日本の論文で治療後1年目のHBeAgからHBeAbへのセロコンバージョン率を記載してあるものを集めて、Funnel Diagramを作成してみた。
![]()
この図は横軸がそれぞれの研究の対象者数、縦軸が1年後のセロコンバージョン率である。点線は単純平均を示す。Funnel Diagramでは例数が少ない、つまりサンプルサイズが小さいとその平均値、この例では1年後のセロコンバージョン率のばらつきが大きくなり、サンプルサイズが大きくなるとばらつきが小さくなって、真の平均値の近くに集まることが示されるはずである。この図を見ると、セロコンバージョン率の高い方に偏っていることが分かる。従って、真の平均値は単純平均よりもっと低い値であることが推測される。なぜ、このような偏りがあるかといえば、それはPublication Biasのためである。おそらく、低いSC率しか得られなかった研究は発表されなかったと推測される。
このようにPublication Biasは実際に存在する。従って、臨床医学論文を読んで真実に迫るためにはそのテーマに関するあらゆる論文を、ポジティブデータもネガティブデータも含めて、できるだけ広いソースから集め、一定のInclusion Criteriaを設けて、問題のある論文は除き、吟味してReviewとしてまとめる作業が必要になる。これはまさにThe Cochrane Collaborationなどが行っていることである。
そこでHepatologyに関して同様の作業をやりたいと思うのであるがいかがであろうか。
(1999.3.18 森實敏夫)
参考文献:The Cochrane CollaborationのThe Reviewer's Handbookからドイツのダウンロードサイトでこのハンドブックをダウンロードしてみてください。MSWordのファイルになっています。他にもReviewManagerというレビュー作成のためのソフトウェアも用意されています。
[Return to 医学統計学講義] [Return to Techniques in Hepatology] [Return to Home Page]