2008/03/07

統計の考え方

科学ではしばしば統計学を用いて、有意かどうかを議論する。
95%の信頼度で~である、とかいう言い方をよくする。
信頼度というのはConfidence Levelと訳され、95%信頼度は95%CLという書き方にもなる。

この95%の信頼度で誤解しやすいのは、95%の確率で正しいということと同じ意味ではないということだ。
それが真理か否か、それは神のみぞ知るところだから、そもそもの正しい確率というのは知ることは出来ない。
そうではなくて、95%信頼度というのは、20回に1回の偶然は認める程度の信頼度という意味である。
つまり95%の信頼度で確認しても、それは実は1/20の偶然によるものかもしれないわけだ。
20回測ると偶然にも1回起こるような、そんな頻度の話だが、それ以上確認しようがないので、それでよしとする。
開きなおりのような態度であるが、そこが人間の限界だから、仕方がない。
あとはその信頼度を上げる努力をするのみである。
信頼度を上げることで、その偶然の可能性を排除していく。

例を挙げる。
ある事象の観測を行ったとして、その分布をポアソン分布とする。
このとき観測された事象が0イベントだったとする。
するとポアソン分布だから、その確率pはp=exp(-λ)という式で与えられる。
この式のλは神のみぞ知りうる、真の期待値が入る。
ここで95%の信頼度を仮定すると、ある期待値λに対して、偶然0イベントが観測される確率は5%であると言える。
ここからλが推定できる。

pはある期待値λに対し、0イベントが観測される確率であるので、p<0.05であればよいわけだ。
これは簡単に計算可能で、p<0.05はλ>3にほぼ一致する。
つまり95%信頼度でλ>3であると言えることになる。

0 件のコメント: