1. 確率とは:この患者さんがこの疾患である確率は

確率とは:

ある事象(event)が起きる回数と起きない回数の合計を分母としてその事象が起きる回数を分子として割算した値がその事象の起きる確率である。

あるトライアルを実行した場合に1種類以上の結果(outcome) の内のどれか1つが起きるとする。そのトライアルをくり返した時ある1つの結果の起きる確率はトライアルの総回数でその結果が起きた回数を割った値となる。

これらニつは同じ事を別の言い方で表わしているだけである。例えば、サイコロをころがす場合、1から6までの目が出るという6種類の結果があり、サイコロをころがすという出来事あるいはトライアルのたびに その内の一つが 起きる。6種類のそれぞれの結果が起きる確率は6分の1である。この場合にはサイコロのそれぞれの目が出る可能性は平等であり6種類の目があるからそれぞれの目が出る確率は 6分の1であり,それぞれの目が出る確率を合計すると1になる。

必ずある出来事が超きるのであれば確率は1であり,絶対に起きることがないのであれば確率は0である。つまり確率は0から1までの値をとる。ある出来事が起きる確率が0.4であれば、それ以外の出来事が起きる確率は1 - 0.4 = 0.6である。

未来は確率でしか語れない:

60歳の人で有病率が10%の疾患があるとする。ある日健康診断で診た60歳の人がその疾患である確率は 0.1である。

死亡率が 10%の疾患にかかった患者が死亡する確率は 0.1である。

さてここで有病率とか死亡率がどうして分っているのかよく考えてみるとそれらは過去の出来事にもとづいて算出された値であることが分る。つまり過去から現在を,あるいは未来を予測しようということを行っているのである。現在起こっている事も,未来に起きるであろう事も結果が出るまでは確率で語ることしかできない。例えばサイコロをころがす時にはこれからどの目が出るか誰にも分らないが1の目の出る確率が 6分の 1 ということはサイコロを振る前から分っていることであり,真理である。


図1.診断の最初のステップ。問診も診察もしていない時点ではその疾患の有病率がその患者さんがその疾患に罹患している確率となる。 病院や診療所を訪れた患者さんは、何か症状があるために来たのであるから、その時点でその疾患に罹患している確率は有病率より高くなると考えられる。その医療機関のその疾患の有病率が分かっていればそれを出発点として診断を進めることが可能になる。

一般的に有病率 Prevalenceはある時点の断面で見た病気の頻度であり、それに対して発症率(罹患率) Incidenceはある一定期間、多くは1年、の間に疾患に罹患する率を表す。従って、発症率は未来を予知する指標であり、有病率は未来を予知する指標ではないと考えられている。ここで、有病率がこの患者さんがこの疾患である確率であり、それで未来を予測するといっているのは、診断が確定するのは未来のことであり、診断をつける一連のプロセスの中で、その疾患であるということを予測するという意味である。有病率は診断の出発点である。

未来を正確に知ることは困難であるが,ある確率である事が起きるということは知ることができる。ある事象がある確率で起きるということは真理である。確率という概念がなかったら統計学はないし近代医学もないであろう。少なくとも臨床医学が科学として成立することはなかったに違いない。

ある確率で起きることを繰り返した場合=患者さんを何人も診た場合:

確率は英語で probabilityなので Pと略して表記される。P = 0.1で起きる事象があるとする。例えば上記の例で 60 歳の人で有病率が10%の疾患がある場合に10人の60歳の人を診たらその内で1人は必ずその疾患の人がいるのであろうか。次の 10人を診た時はどうであろうか。直感的に分るはずであるが実際には2人いる場合もあるかもしれないし, 1人もいない場合もあるかもしれないが,1人いるという場合が一番多いだろうということが理解される。 10人を診た時に 10人ともその疾患にかかっているということもありえないことではないが非常にまれだろうということも直感で理解できる。10人を診るということをくり返した場合にその疾患をもつ人が 0人の場合,1人の場合,2人の場合,3人の場合,4人の場合...それぞれの起きる確率はニ項分布に従う。

図2.サイコロを振った場合の二項分布。ある値、この例では3回が一番確率が高く、つまり18回さいころを転がすと1の目が3回出る場合が一番多く、それから遠ざかるに従って、確率は低くなることがよく分かる。これはわれわれの直感とも一致する。

ニ項分布は比率や割合の有意差検定で出てくるがここでは直感的に考えるだけで十分である。もしこの例で 10人の患者を見て4人がその疾患にかかっていたとしよう。もし 10人に 1人の割合,つまりその疾患の有病率が 10%の母集団からランダムに抜き出した 10人のサンプルなら 4 人が その疾患にかかっているということが遇然にも起きるという確率は非常に少ない。その場合には従って別の母集団,例えば有病率が40%位の集団からランダムに抜き出した 10人のサンプルと考える方が正しいということになる。こういう場合にある P値,つまりある確率で有意差があるというのである。図3を見れば分かるが、その事象が起きる確率が10回に1回、すなわち0.1の場合、それを10回繰り返した際にその事象が10回中に起きる数をXとして横軸に、そしてその確率を縦軸に表示した二項分布であるが、X=4の場合の確率は0.05以下になっている。従って、この例でもし10人の患者を診て、4人がその疾患に罹っていることが偶然に起きたとすると、そのような事が起きる確率は0.05以下であることが分かる。この0.05という数字は統計学的に有意とするかどうかで最も広く用いられている数字である。


図3.確率0.1で起きる事象を10回繰り返す場合の二項分布。その事象の起きる確率が10回に1回、すなわち0.1の場合、それを10回繰り返した際にその事象が10回中に起きる数をXとして横軸に、そしてその確率を縦軸に表示した。

ここで注意しなければいけないのはランダムに抜き出されたサンプルであるということである。別の言い方をすると母集団を代表するようなサンプルを得られたかどうかである。臨床医学研究においてはサンプルが母集団を偏りなく正しく代表しているかどうかいつも大きな問題となる。それは統計学の問題ではなく研究デザインとその実行の問題である。サンプルの集収でバイアスが入り込んでいてはあとの統計学的解析をどうやろうと真実を明らかにすることはむずかしくなる。母集団というのはある要素を共通に持っている群のことである。そしてランダムなサンプルというのは母集団を構成するそれぞれの人がサンプルとして選ばれる確率が等しいということである。これは非常に重要なことである。

図2、3の様な二項分布を作成するためのExcelの表をダウンロード。(黄色のセルのデータ、nとπを変えるとグラフに反映される。Windows WinZIP自己解凍型ファイル、ファイルサイズ25KB)。

偶然起きること

さて、健常者の血糖値や、血清カリウム濃度、BUNなど多くの検査値はある値の周辺に多く分布し、左右に遠ざかるほど、頻度が少なくなる。左右対称で釣鐘型の分布である。この分布は1733年にフランス人数学者Abraham Demoivreによって発見され、その後二人の数学者・天文学者Pierre-Simon LaplaceとCarl Friedrich Gaussによって科学的な基礎が作られた正規分布に非常に近い。正規分布は数学的に表現され、計算の容易な平均値と標準偏差の二つによって規定されるので取り扱いが簡単である。そこで、さまざまな検査値について平均値と標準偏差を算出して、平均値 ± 2標準偏差を正常範囲あるいは基準値とすることが普通行われている。

正規分布はNormal Distributionと呼ばれ、いかにも正常の分布を示すかのように思われるかもしれないが、正常ということとは別のことである。理論的に考え出された連続的な値、つまり数値データの分布の一つである。ちなみに、二項分布もnを大きな数値にして、πを0.5にすると正規分布と同じ形の分布になる。Normal Distributionという名称は誤解を招く可能性があるのでGaussian Distributionガウス分布という言葉が使われることもある。

平均値 ± 2標準偏差の範囲にはデータの約95%が含まれるので、正常範囲あるいは基準値には健常者の95%の検査値が含まれるということになる。逆にいうと特に病気の無い人の5%は基準値外の検査値を呈するということになる。別の言い方をすると健常者が一つの検査を受けて正常範囲の結果が出る確率はその人が本当に健康であっても0.95である。必ず100%正常値が出るというわけではない。

そこで、もし20種類の検査を受ける場合に健常者であってもすべての検査値が正常値あるいは基準値におさまる確率は、0.95 x 0.95 x ..と0.95を20回掛け合わせた値になる。つまり0.9520=0.36である。これは確率の掛け算の法則(乗法定理) Multiplication Ruleで説明される。つまりそれぞれの検査値が正常範囲に入る確率は0.95であり、それぞれの検査は独立しているとすると、2つの検査が正常範囲に入る確率は0.95 x 0.95となり、3つの検査が正常範囲に入る確率は0.95 x 0.95 x 0.95つまり0.95の3乗となる。

さいころの例で考えてみると分かりやすい、さいころを2回転がして、1回目も2回目も1の目が出る確率は1回だけ1の目が出る確率より低いということは直感的に分かるが、それは1/6 x 1/6 = 1/36となる。(2個のさいころを転がして2つとも1の目が出る確率も同じである。この場合には2個のさいころの目の組み合わせを考えてみると6 x 6 = 36通りあり、2個のさいころが1の目である組み合わせはその中の1つであるから、1/36であるという計算もできる。)さらにもう一度転がしてまたもや1の目が出る確率はさらに低くなることはすぐに分かるが、それは1/6の3乗で1/216となり、起こる可能性は非常に低くなることが分かる。Aの事象とBの事象の起きる確率がP(A)、P(B)である場合、AおよびB、つまりA and B、の両方が起きる確率は二つの確率を乗算した値、つまりP(A and B) = P(A) x P(B)となる。3個以上の事象の場合も同じように掛け算して行けば良い。

さて、健常者が20種類の検査を受けると、どれか1つの検査が必ず正常範囲から外れることになる。それは確率の足し算の法則 (加法定理)Addition Ruleによって説明される。つまり、一つの検査が正常範囲から外れる確率は0.05であるから、2つの検査のいずれかが正常範囲から外れる確率は0.05 + 0.05 = 0.01となる。つまり、Aの事象とBの事象の起きる確率がP(A)、P(B)である場合、AまたはB、つまりA or B、のいずれかが起きる確率は二つの確率を加算した値、つまりP(A or B) = P(A) + P(B)となるのである。これも直感的に理解されるはずである。いずれかが起きれば良いのであるから、それぞれが起きる確率より高くなることが分かるはずである。したがって、20個の検査を施行する場合には、0.05を20個加える、つまり0.05 x 20 = 1.0となり、確率が1.0ということは必ずそれが起きるということであるから、健常者が20種類の検査を受けると、どれか1つの検査が必ず正常範囲から外れることになるのである。(下記解説参照のこと)。

これらは偶然起きることであって、正常範囲から外れた検査値が出たから、何か異常があって、病気があるということではないし、検査法に問題があるということでもない。正常範囲をどのように設定するかということによって起きてくる現象である。

*確率の計算をするときには確率を0から1までの数字で表す方が簡単なので、そうするが、%を用いて、0から100%の数字で表す方が分かりやすいかもしれない。

偶然起きること:二人の医師の読みが一致する

画像診断、病理組織診断などにおいて読影者あるいは病理医によって読みが異なることがあってもそれは当たり前のことであると考えるのが正しい考え方である。エキスパートの読みと自分の読みが違っていても、自分が悪いとは限らない。エキスパートの間でも読みの異なることは起きうることであり、これら観察者による解釈の相違は避けられない。

二人の観察者の所見の一致率も偶然による一致を考慮しないと見かけ上の一致率だけを見ていたのではいけない。偶然によらない一致率の指標としてKappa (κ) coefficient(係数)が用いられる。2分割表を作成してκがどのようなものか考えてみよう。この例は二人の病理医により242個の病理組織標本を独立して別々に診断した成績である。
 
観察者A
陽性 陰性 合計
観察者B 陽性 59 6 65
陰性 11 166 177
合計 70 172 242

見かけ上の一致率は(59 + 166)/242 = 0.93つまり93%となる。つまり観察者AもBも陽性と判断した例数と陰性と判断した例数を合計した例数において一致しているから、それを観察した全例数で割り算すれば良いわけである。それ以外の例では二人の判定は一致していない。

この見かけ上の一致率の中で、偶然によって一致している部分はどれくらいあると判定したら良いのであろうか。観察者Aは242例中70例を陽性と判断しており、Bは同じく65例を陽性と判断しているので、二人が偶然一致して陽性と判定する確率は(70/242) x( 65/242) = 0.078となる。これは確率の掛け算の法則である。すると両者が陽性と判定したのは見かけ上は59例であるが、その中で242 x 0.078 = 18.9人は二人の意見が一致して陽性と判定したのではなく偶然一致しただけのことになる。一方両者が陰性と判定した166例についても同様な計算を行うと、(172/242) x (177/242) x 242 = 125.8例は偶然意見が一致して陰性の判定を下したことになる。全体として242例中18.9  + 125.8 = 144.7例、従って、144.7/242 = 0.598つまり59.8%は偶然によって一致することになる。これは二人の観察者がディスカッションをすることなく独立して判定した場合のことである。

偶然による判定の一致率が0.598であるから、1 - 0.598 = 0.402は偶然によらない一致率ということになる。これは確率の足し算の法則からそうなる。この値が、理論的に推定される偶然によらない一致率であり、κの分母になる数値である。実際に得られた、あるいは実際に起こったといっても良い、一致率、つまり一方見かけ上の一致率は0.93でそのうち0.598は偶然による一致であるから、偶然によらない一致率は0.93 - 0.598 = 0.332となる。この0.332を0.402で割り算した値がκである。この例では0.82となり、かなり高い一致率となった。

κが0の場合には二人の観察者の判定の一致はまったくの偶然によるものといえる。

κは見かけ上の一致率が同じ場合でも、二人の観察者が両者とも陽性と判定する割合と、陰性と判定する割合が変わると変動する。2分割表でいうと、左上と右下の数値である。図4に示すように二人の観察者の間でκが一番大きくなるのは見かけ上の一致率の中で陽性と判定した割合と陰性と判定した割合が同じ場合であることがわかる。すなわち、陽性率が50%の場合にはκが最も大きな値となり、二人の観察者の判定の一致率が最も高くなる。陽性率が何%になるかはそれぞれの検査によって異なるし、同じ検査でも対象の選択によって異なってくる。


図4. 二人の観察者が100の判定を行った場合の判定一致率。判定が不一致の割合は同数と仮定して計算したκ係数値である。たとえば、見かけ上の一致率observed agreementが0.9の場合、100の判定の内観察者Aが陽性と判定し観察者Bが陰性と判定した数と観察者Aが陰性と判定し観察者Bが要請と判定した数をそれぞれ5として計算した。

図4の様なKappaを計算するためのExcelの表をダウンロード。(Windows WinZIP自己解凍型ファイル、ファイルサイズ27KB)。

偶然起きること:意図しない比較

バイアスというのは系統的に入り込むデータの片寄り、あるいは真の値を推定する際にさまざまな段階で起きうる真の値からはずれるプロセスのことであるが、バイアスが無い場合でも偶然によって、データの片寄りが起き真の値からそれてしまうことがありうる。実際さまざまな統計学的な検定法で群間の比較をする際に得られるP値は本当は群間に差が無いのに偶然によって差があるという結果が得られる確率を示している。

一般的にretrospective 後ろ向きの研究の場合には既に過去において起きてしまった事象がデータとして存在して、そのデータの山の中で何か意味のある、今までに誰も気づいたことの無いことを見つけようという考えを持つ人が多いかもしれない。つまり、本当の山の中に分け入り金の鉱脈を発見するようなことを考える人が多いのではないか。しかし、これは臨床研究では正しい考え方ではない。たとえば、症状の有無は患者さんに医師がたずねて、それを記録してなければ、それがあったのかどうなのかは後になってしまっては分からなくなってしまう可能性が高い。患者さんが気づいていない、あるいは気づいていても医師に伝える必要性を感じなかった症状の場合には特にそうである。臨床研究は最初に仮説を立てて、それを明らかにするための研究をデザインして、実行計画を立ててから開始することが必要である。

いろいろな変数の間で関連や、有意差の検討をすると、実際には意味のない関連が有意であるという結果が出てしまったり、群間で平均値に有意差が出たり、群間で割合に有意差が出てしまったりする可能性が高まる。たとえば、20個の統計学的検定を行うと1つは偶然によって、P値が0.05以下で有意差が出てくる可能性がある。しかしこれは偶然によってそうなっただけであり医学的な意味の無い可能性が高いことを考えなければならない。
 
 
●ブール論理 Boolean Logic
 論理学におけるORの用法については一般言語における用法と同じ場合と違う場合がある。つまり一般言語でORを使う場合、A OR BはAとBどちらかを含むものを意味するので、AとBと両方含むものも含む意味で使われることが多い。一方もう一つのORはexclusive OR 排他的OR (Xorと表記される)と呼ばれるもので、A OR BはAまたはBのいずれかを含むもので、AとBと両方を含むものは除く。統計学では普通は後者のXorの意味でORを用いる。ANDやORの論理学的意味については19世紀に活躍した英国の数学者George Boole(1815-1864年)にちなんでBoolean logicと呼ばれる。コンピュータプログラミングにおけるBooleanと呼ばれる変数はFalseとTrueのいずれかを意味する変数として用いられている。

事象Aと事象Bが同時に起きることが無い場合には排反事象 Exclusive eventと呼ばれる。その場合にはAまたはBが起きる確率はP(A or B) = P(A) + P(B)である。しかし、もしAとBが同時に起きる可能性がある場合にはその分を引き算する必要が出てくる。つまり、P(A or B) = P(A) + P(B) - P(A) x P(B)である。上記の例では排反事象と仮定している。

●ベイズ定理 Bayes's theorem
医学の分野では事象Aと事象Bが同時に起きることの方が多い。たとえば、黄疸とB型急性肝炎という事象は同時に起きうる。このような同時に起きうる事象の確率については18世紀英国の聖職者Thomas Bayesにより確立された条件つき確率(条件確率)Conditional probability関する定理Bayes's theoremを用いて算出しなければならない。黄疸の起きる確率をP(I)、B型急性肝炎の起きる確立をP(B)とした場合に、両方が起きる確率P(I and B)は確率の乗法定理により、P(I) x P(B)と考えられるが、これは間違いである。つまりIとBの二つの事象が独立している場合に限って乗法定理が適用されるのであり、黄疸とB型急性肝炎というような独立していない、同時に起きうる事象については適用できない。(従って、上記の例はそれぞれの検査が互いに独立していることを仮定した場合にしかあてはまらない)。

条件つき確率とはある事象が起きた条件下において別の事象が起きる確率のことで、たとえばBという事象が起きるとういう条件が満たされた場合にAという事象が起きる確率はP(A | B)と表記する。ここで取り上げた例ではB型急性肝炎が起きた場合に黄疸の起きる確率はP(I | B)と表される。この値はB型急性肝炎の起きる確率P(B)は問題にせず、B型急性肝炎の起きた中で黄疸が起きることとそれ以外、すなわち黄疸が起きないことを問題にしている。従って、B型急性肝炎が起きた場合に黄疸の起きない確率をP(non-I | B)で表すと、P(I | B) + P(non-I | B) = 1となる。つまり、B型急性肝炎の患者さんのデータを集めて、黄疸が出た患者さんの割合を調べた場合にP(I | B)が求められる。一方、B型急性肝炎の起きる確率P(B)は対象とする人口における発症率から求めることができる。そして、その人口の中でB型急性肝炎になり黄疸の出る確率はP(B) x P(I | B)となる。これは条件つき確率をどう定義しているかが分かれば容易に理解できるはずである。

一方で黄疸が起きるのはB型急性肝炎が起きた場合だけではない、A型急性肝炎の場合もあれば、膵頭部癌の場合もある。そこで、黄疸が起きた場合にB型急性肝炎である条件つき確率はP(B | I )で表され、黄疸の起きる確率をP(I)とすれば、P(I) x P(B | I )が黄疸が起きてB型急性肝炎である確率となる。ところが、B型急性肝炎になり黄疸の出る患者さんと黄疸が出てB型急性肝炎である患者さんは同じ人たちである。ということはP(I) x P(B | I )とP(B) x P(I | B)は等しいということになる:

P(B) x P(I | B) = P(I) x P(B | I )

この式の項の配置を変えると、P(I | B) = P(I) x P(B | I ) / P(B)となる。つまり、B型急性肝炎であって黄疸のある確率はいろいろな症状の確率とは独立しているB型急性肝炎である確率P(B)と、いろいろな疾患である確率とは独立している黄疸の起きる確率P(I)という二つの要素によって規定されていることが分かる。これら二つの独立した確率は事前確率Prior probabilityと呼ばれる。なお、この式はP(B | I) = P(B) x P(I | B) / P(I)と表すこともできる。また、P(I | B)とP(B | I)は事後確率Posterior probabilityと呼ばれる。

P(I) = P(B) x P(I | B) / P(I)のBをある疾患、Iをある検査法あるいは診断法の陽性結果に置き換えると実はその結果が陽性に出た場合のその疾患である確率を求めることができる。コンピュータプログラムによって疾患の診断を行う、Clinical Diagnostic Decision Support System (CDDSS)にはいくつかの方法論が用いられているが、Iliadなどはベイズ定理に基づいたBayesian networkという手法を用いている。

Bayes T: An essay towards solving a problem in the doctrine of chances. Philosophical Transactions 1763; 3:370-418.



(1999.3.4 神奈川歯科大学 内科学教授 森實敏夫) 
医学統計学講義目次に戻る