2. 診断のプロセス: Predictive Valueとは

診断を付けるとは:

診断を付けるということは本来的に不確実で間違いの起きやすいプロセスである。治療を開始する前に出来るだけ確実な診断を付ける努力が必要であるが、確実な診断付けるとはある疾患に罹患しているであろう確率を高めるプロセスであり、完全に100%に到達するのはなかなか難しいことが多い。

そんなはずはないと思われる人も多いと思うが、99%の確率である疾患だと診断できる検査があるとすると、同じ疾患の患者さんを50人診て検査を行っても1人も診断を間違えるということはないのは確かである。そのような間違えを起こす確率は低いのである。しかし、もし、200人診たら1人あるいは2人くらい診断が難しい例があって、診断を間違えることがあるかもしれないということは理解されるのではないか。実際、症例報告されるような例にはそのような診断が難しい例が多いし、どの医師もそのような例を経験されていると思う。

従って、まず診断を付けるとはその患者がある疾患に罹患しているであろう確率を高めるプロセスであることを認識しよう。

診断の確率を決める因子:

診断の確率を左右する因子は何か考えてみよう。ここでは問診、理学的検査(診察)、検査をすべてある疾患を捉える検査と考えてみよう。その検査の結果が陽性であれば、その疾患に罹患していることが分かり、結果が陰性であればその疾患には罹患していないことが分かる。大半の人は精度の高い検査を行えば、確実な診断が付けられると考えているが、それは実は単純すぎる考え方である。というのはどのような検査であれ、その疾患に罹患している患者さんでは100%陽性の結果が得られ、その疾患に罹患していない人では100%陰性の結果が得られる検査というものは存在しないからである。これらの指標を検査の敏感度(感度、Sensitivity)特異度(特異性、Specificity)と呼ぶ。つまり、その疾患に罹患している患者さんでの陽性率をSensitivity、その疾患に罹患していない人での陰性率をSpecificityとよぶ。そして、診断の確率を左右する因子はこれら2つだけではなく、もう一つあり、それは検査前確率 Pretest probability (事前確率 Prior probability)あるいは有病率 Prevalenceである。この3つ目の因子を正しく理解している人は少ない。 まず下記の表1でSensitivityとSpecificityがどのような指標かを理解しよう。

 表1:SensitivityとSpecificity
疾患あり 疾患無し
検査結果陽性 a人 c人
検査結果陰性 b人 d人

Sensitivity = a/(a + b) x 100 (%)   False negative rate = b/(a + b) x 100 (%)

Specificity = d/(c + d) x 100 (%)   False positive rate = c/(c + d) x 100 (%)

100 - Sensitivity = False negative rate

100 - Specificity = False positive rate

一つの例:

そういわれてもピンとこないと思う人も多いと思うので簡単な例を取り上げてみよう。例えば、HIVの抗体検査はEIA法でSensitivityが98.3%、Specificityが99.8%だそうである[1]。ここでは分かりやすくするために類似の仮定のウイルス感染を想定して考えてみることにする。あるウイルスの感染の有無を調べる検査があって、Sensitivityが99.9%でSpecificityが99.9%と仮定してみよう。ということはそのウイルスに感染している人を調べると99.9%が陽性の結果となり、感染していない人を調べると99.9%が陰性の結果になるということである。そこで、もしそのウイルスに感染している人が0.01%、つまり1万人に1人いると仮定すると、それらの人を対象にこの検査を施行した場合にはどのような結果になるであろうか。5万人を検査するとすると、その中には5人そのウイルスの感染者がいるはずである。この人たちの血液を調べるとSensitivityが99.9%であるから 5 x 99.9/100 = 4.995人が陽性の結果になるはずである。(ここでは確率で考えている)。一方そのウイルスに感染していない人は残りの4万9千9百95人であるが、この中で陽性の結果が出るのはSpecificityが99.9%であるから、49,995 x (100 - 99.9)/100 = 49,995 x 0.001 = 49.995人となる。従って、陽性の結果が出るのは4.995 + 49.995 = 54.99、つまり約55人となる。しかしこの中で本当にそのウイルスに感染している人は4.995人つまり約5人であって、残りの約50人は本当はそのウイルスに感染していないのに検査結果は陽性、つまり偽陽性の人たちである。つまり、陽性の結果が出ても約9%の人しか実際にそのウイルスに感染していないことになる。従って、このように感染率の低い群を対象にこの検査を施行すると、これでは感染を診断するというより、混乱を招くだけになってしまう恐れがある。

一方でそのウイルス感染のハイリスク・グループを対象にした場合にはどうなるであろうか。ここでそのウイルスに感染している人の割合が0.1%であるハイリスク・グループを想定してみよう。先ほどの10倍である。5000人を対象にしたとして、同じように計算してみよう。(5万人でも結果は同じである)。実際にそのウイルスに感染している人は5人いるはずである。残りの4995人は感染していない。すると陽性の結果が出る人数は、5 x 99.9/100 + 4995 x (100 - 99.9)/100 = 4.995 + 4.995 = 9.99人となり、この場合には約10人陽性の結果が出て、その内の約5人つまり、50%が本当にそのウイルスに感染していることが言える。

感染率のさらに高いハイリスク・グループを対象にした場合を考えてみよう。例えば、1%の人がそのウイルスに感染している対象者5000人で同じ検査を施行すると、同じように計算して、陽性の結果が出るのは 50 x 99.9/100 + 4950 x (100 - 99.9)/100 = 54.9人であり、その内の49.95人つまり約50人が実際に感染していることになる。つまり、約55人中50人、約91%である。

同じ検査を施行しても対象者によってこれほどその意義が違うのである。

Prestest Probability 検査前確率:

上記の例で感染している人の割合を0.01%とか、0.1%とか、あるいは1%とか述べたが、これは対象群の有病率 Prevalenceに相当する。一般にある検査を施行する前にその検査の結果が陽性であると出た場合に診断される疾患を持っている人の割合を検査前確率 Pretest probability、あるいは事前確率 Prior probabilityという。一般の人を対象に検査を行う場合には一般人口の有病率がPretest probabilityになる。しかし、ある症状を訴えて病院や診療所を訪れた人を対象にした場合には一般人口の有病率ではなく、その医療機関受診者における有病率が適用されなければならない。

従って、人間ドックや健康診断のように健康と思われる人を対象にスクリーニング的に検査を行う場合と、ある症状があって医療機関を訪れる人を対象に検査を行う場合では同じ検査であっても陽性の結果が出たときの意味が異なる。特に有病率が低い疾患については検査結果が陽性と出ても偽陽性の確率が高くなるし、逆に陰性の結果が出てもその病気でない確率はほとんど変わらないことになる。

一般の診療においては患者さんはある訴えをもって医療機関を訪れているためにPretest probabilityがある程度高い状態で診断のプロセスが開始されるため、人間ドックや健康診断の場合などと比べて、同じ検査を施行しても正しい診断を付けられる確率がより高くなる。問診を終えてから、あるいは診察を終えてからその患者さんがある疾患に罹患していると想定される確率はそれぞれの医師によって異なる可能性がある。これはDoctor's index of suspicionと呼ばれる。通常は患者さんが病院を訪れる前のPretest probabilityは一般人口の有病率に相当し、病院を訪れた時点でその病院での有病率に相当し、問診の後ではその医師の判断によるDoctor's index of suspicionに相当し、診察の後でもその医師の判断によるDoctor's index of suspicionに相当する。従って、ステップが進み検査を受ける前の時点ではPretest probabilityがかなり上昇していることになる。

Predictive Value 陽性予測力または陽性適中率:

Predictive value, Predictive value of a positive test, Positive predictive value, Posttest probability, Posterior probabilityは同じ意味である。つまり、ある検査が陽性の結果が出た場合に本当にその疾患に罹患している確率を意味する。上の例で計算したのはこのPredictive valueであり以下の式で表される。別の言い方をすると、Predictive valueは偽陽性、偽陰性を考慮したその検査法の診断的価値 Diagnostic performanceと考えることが出来る。

Predictive value (%)
= Pretest probability x Sensitivity/100/{Pretest probability x Sensitivity/100 + (100 - Pretest probability) x (100 - Specificity)/100}

Pretest probabilityが低い場合には陽性の結果が出ても本当にその疾患である確率はそれほど高くないことが上の例で理解できたと思う。つまり、有病率と検査の敏感度、特異度によって陽性の結果が出た場合の疾患である確率が決まってくるのである。

一つ重要な点はPredictive valueはPretest probabilityによって大きく変動するということである。その検査を施行しようとする対象によって同じ検査でも診断における意義が違ってくる。 図1を見ていただければその事が良く理解されるはずである。

図1:Positive Predictive Value

図1,2のExcelの表ダウンロード(Windows95で作成, WinZIP自己解凍ファイル33KB)

Negative Predictive Value 陰性予測力または陰性適中率:

一方で、陰性の結果が出た場合にその病気ではない確率をNegative Predictive Valueという。つまり陰性の結果が出た人の中に占める疾患に罹患していない人の割合のことである。言い換えると、陰性の結果が出た場合に本当にその疾患には罹患していない確率を表す。偽陰性と偽陽性を考慮した指標であり、疾患を除外する際のそのDiagnostic performanceの指標である。

Negative Predictive value (%)
= (100 - Pretest probability) x Specificity/100/{(100 - Pretest probability) x Specificity/100 + Pretest probability x (100 - Sensitivity)/100}
 

有病率が低い疾患の場合にはもともとその疾患である確率が低いので、検査をして陰性の結果が出ても病気でない確率はそれほど変わらない。疾患をルールアウトするためにはSensitivityやSpecificityがそれ程良くない検査でもかなり有用なことが下の図を見ると理解される。別の見方をすると、SensitivityやSpecificityがそれほど高くない検査を有病率の低い疾患をルールアウトするために用いてもあまり意味がないともいえる。 有病率が低い疾患、言い換えると珍しい疾患を確実に除外したい場合にはSensitivityとSpecificityの非常に高い検査が必要とされる。

図2:Negative Predictive Value

複数の検査:

さて、複数の検査を施行するのが通常の臨床におけるやり方である。 その場合にも2つの検査の進め方がある。

Serial Testing:
 1つは複数の検査を前の検査結果が出てから順次行うやり方である。この場合には診断が次第に絞り込まれて行くことになり、敏感度と陰性適中率は低くなるが、特異度と陽性適中率は高くなる。特異度の高い検査を先に行って、その後に敏感度の高い検査を行う方が検査を施行する対象者が少なくなるので通常はその順序で行う。あるいは安価な検査を先に行うのでも良い。しかし、最終的な診断力は同じである。

Parallel Testing:
 もう1つは平行して同時に複数の検査を行うやり方である。この場合には敏感度と陰性適中率は高くなるが、特異度と陽性適中率は低くなる。そして、それぞれの検査が同じ現象を捉える方法か、それとも異なる現象を捉える方法なのか、オーバーラップがどれ位あるのかによって、そのDiagnostic performanceは異なってくる。別の言い方をするとそれぞれの検査がどれくらい独立しているかによって、全体としてのパフォーマンスが異なってくる。いくつかの検査がある疾患で陽性になる場合に一つが陰性でも他の検査が陽性になれば敏感度は上昇することは容易に理解される。[3]

従って、多変量解析 Multivariable Analysisによって、複数の検査結果による診断への適用を検討するのが望ましい。例えば、ロジスティック回帰分析 Logistic Regression Analysisによって、ある疾患の有無を従属変数としていくつかの検査の結果を独立変数として解析し、それぞれの症例の結果を代入してその疾患であることの確率を計算することが可能である。この場合、確率が0.5を超えればその疾患と診断する。

(1999.2.8 神奈川歯科大学 内科学  森實敏夫)



文献
[1] Cleary PD, Barry MJ, Mayer KH, et al: Compulsory premarital screening for the human immunodeficiency virus: Technical and public health considerations. JAMA 1987; 258:1757.

[2] Gehlbach SH: Interpreting the medical literature. (3rd edition), 1993, McGraw-Hill, Inc. New York, USA.

[3] Fletcher RH, Fletcher SW, Wagner EH: Clinical epidemiology: The essentials. (3rd edition), 1996, Williams & Wilkins, Baltimore, USA.



[医学統計学講義] [ホームページ]