2023年6月23日金曜日

NHK高校講座の数学Ⅰの統計的仮説検定に関する理解度チェック問題は、母平均の検定を念頭に置いていない蓋然性が高い

このエントリーをはてなブックマークに追加
Pocket

NHK高校講座の数学Ⅰの統計的仮説検定に関する理解度チェック問題が、間違っているのではないかと話題になっている。

統計的仮説検定では、分布のパラメーターがある値である等号の式を帰無仮説としてとることが多く、片側検定の場合は不等号で表記することもあるといった慣習なのだが、不等号の帰無仮説のみを正解としているからだ。

1. 母平均の検定と考えるとおかしい模範解答

問題文は以下で、

Aさんは「内容量100g」と表示されているお菓子を一袋買いました。このお菓子は、工場でパッケージされ大量に流通しているものです。Aさんは内容量が少し少ないように感じ、重さを測ってみました。すると、95gしかありませんでした。

Aさんは、「自分が買った袋だけではなく、この商品そのものの内容量が100gより少ない(つまり不正表示をしている)のでは?」と考えました。この主張が正しいかどうかを仮説検定を用いて調べるために、Aさんは同じお菓子をいくつか購入してきました。

帰無仮説はどれでしょうか。正しいものを選んでください。

模範解答では「この商品は100gちょうどである」が誤りで、「この商品は100g以上である」が正解となっている。

2. 高校の数学Ⅰではt検定やZ検定は使えない

平均100gを帰無仮説とした仮説検定だと考えれば、「100gちょうど」が不正解は確かにおかしい。しかし、高校の数学Ⅰの学習範囲では、母平均が「100gちょうど」という帰無仮説を置けない。高校の数学Ⅰの段階では、平均値の検定は教えていない。正規分布を仮定した検定も、後で習う数Bの範囲とされている。

3. 二項分布で何とかしよう

数学Ⅰではコイン投げの観測値を、パラメーターの値が0.5の二項分布にあてはめてp値を計算することしか、どうやらしない。この問題も、お菓子の重量が従う確率分布は述べられていないし、重量の平均値が100g未満であることを検定したいとも書いていない。コイン投げの話と同様に考えよう。

買った袋の数をm、その中で100g以上の袋の数をnとして、許容最低限の100g以上の袋の相対頻度(e.g. 1割)をパラメーターとした二項分布で相対頻度n/mが観測される確率が、有意水準(e.g. 0.05)よりも小さければ、100g以上という帰無仮説が棄却されると言う検定を念頭に置かれているのではないであろうか。許容水準以下という帰無仮説が棄却されれば、100g以上という帰無仮説も棄却される理屈なのがややこしいが、二項分布にするので「100gちょうど」は帰無仮説として使えなくなるし、まだ教えていない手法を利用することもない。サンプルサイズは「いくつか購入」では済まないが。連続変数を離散変数に変換して検定をかける行為は、悪い統計手法として知られている。

どちらにしろ「この商品そのものの内容量が100gより少ない」ことを検定する方法は、他に平均値や中央値を見るなど色々とあるのでこの問題の模範解答はおかしいが、出題者の念頭にあったのは以上のような話だと考えられる。

4. 高校で統計的仮説検定を教えるのはやめよう

統計的仮説は、統計哲学的にも、数理的にもややこしい概念な上に、ひとつの問題に対して複数のアプローチをとることができる。伝統的に研究ではよく用いられるが、無理に学んでもロクなことはない。賢い学術博士で構成されるアカデミアで、統計的仮説検定を使うなと言う話が出てくるぐらいだ。実業界からは実用的ではないという声もよく聞こえるし、ベイズ統計学では用いられない。母平均の不偏推定量の出し方や、よく使われるチャートをしっかり学ぶ方が無難だし実用的。高校で統計的仮説検定を教えるのはやめよう。

0 コメント:

コメントを投稿