2023年2月14日火曜日

信頼区間を説明する前に知っておくべき変態的な例

このエントリーをはてなブックマークに追加
Pocket

推定された信頼区間を母集団のパラメーターが95%の確率で入っている区間と説明するなんちゃって解説はよくされており、昨日も中堅私大のマーケティング分野の大学教員がウェブ媒体でそのような説明をしていた。しかし、観測値から実際に計算された信頼区間は、母集団のパラメーターがある確率で含まれる区間ではない。

ややこしいので世界中で勘違いされている信頼区間だが*1、理解を深めるための変態的な例であるWasserman (2010)の6.14 Exampleを紹介したい。Berger and Wolpert (1984)が元ネタと書いてあるので、恐らく語り継がれている有名な例。

さて、定数のパラメーターθがあり、ベルヌーイ分布に従って確率変数X₁とX₂が抽出されるとする。X₁とX₂は1か-1の値をとり、その確率はP(Xᵢ=1)=P(Xᵢ=-1)=1/2半々とする。X₁とX₂は観察不能であるが、Yᵢ=θ+Xᵢと定義される変数Yᵢ、つまりY₁とY₂は観測できる。ここで1点からなる区間Cを、Y₁=Y₂のときはY₁-1、Y₁≠Y₂のときは(Y₁+Y₂)/2と定義する。すると、真のパラメーターθに関わらず、このCは75%信頼区間となる。実際、

  • (X₁,X₂)が(-1,-1)のときは、(Y₁,Y₂)が(θ-1,θ-1)になって、C:(θ-1)-1=θ-2
  • (X₁,X₂)が(1,-1)のときは、(Y₁,Y₂)が(θ+1,θ-1)になって、C:{(θ+1)+(θ-1)}/2=θ
  • (X₁,X₂)が(-1,1)のときは、(Y₁,Y₂)が(θ-1,θ+1)になって、{(θ-1)+(θ+1)}/2=θ
  • (X₁,X₂)が(1,1)のときは、(Y₁,Y₂)が(θ+1,θ+1)になって、C:(θ+1)-1=θ

となり、3/4の確率でθ∈Cとなる。

ただし、P(θ∈C)=3/4=75%であって、観測されたデータによって条件付けられていない。Y₁とY₂はどちらも数値が定まった値ではなく、信頼区間Cもθ-2かθのどちらかに計算されるアルゴリズムであって、具体的な数値で示される区間にパラメーターが入る確率P(θ∈C|Y₁,Y₂)では無い。

Y₁とY₂が定まっているときに信頼区間Cに真のパラメーターが含まれる確率P(θ∈C|Y₁,Y₂)は、Y₁≠Y₂のときは100%で、Y₁=Y₂のときは主観的に50%(厳密に言えば0%か100%)となる。Y₁≠Y₂のときの75%信頼区間には、真のパラメーターが100%の確率で含まれている。75%信頼区間なのに、観測されたY₁とY₂から実際につくった区間に真のパラメーターが入る確率は75%ではないわけだ。

信頼区間は統計的仮説検定の棄却域と一致し、効果量と統計的仮説検定の結果を同時に把握できる道具で、どうしても効果量を軽視して解釈してしまう統計的仮説検定の代わりに使う流れが出来ているのだが、真面目に考えると小難しいシロモノである。

*1P値、信頼区間、検出力は誤用が多いので、啓蒙目的の論文が書かれていたりする:Greenland et al. (2016) "Statistical tests, P values, confidence intervals, and power: a guide to misinterpretations - PMC," Eur J Epidemiol, Vol.31(4), pp.337–350

0 コメント:

コメントを投稿