2018年4月15日日曜日

お気軽確率・統計ユーザーのための必須数学知識チェックリスト

このエントリーをはてなブックマークに追加
Pocket

測度論などは使わないぐらいのお気軽な確率・統計の利用者でも、ある程度は数学的に確率・統計を説明できる方が望ましい。学部一般教養の微分積分と線形代数を学べば良いのだが、もう少し具体的な目標があっても良いかも知れない。

以下に20項目の必須数学知識チェックリストを用意してみた。チートペーパーを整備するなりしてでも説明できるようにしておこう。慣れてくると飲み過ぎのチェックにも使える*1

1. ベイズの定理の証明

話の前段として大人気の定理だが、伝統的な統計学の教科書は頻度主義なので使い道が意外にない。条件付確率の定義が説明できれば、ほぼ自明。

2. 分散の加法性の証明
分散の加法性はよく使われる。例えば、不偏分散の導出や大数の法則の証明に使える。しかし、分散の加法性の証明は二重数列/積分になり横に長くなるせいか、割愛気味の事も多いようだ。

3. 不偏分散の導出
不偏分散の計算が理屈抜きの丸暗記になっていたりしないであろうか。標本分散が母分散の(観測数-1)倍である事は、観測値と母平均の差の項を、観測値と標本平均の差の項と、標本平均と母平均の差の項に分けて整理すれば導出することができる。

4. 二項分布からポアソン分布を導出

資格試験で人気の計算。二項分布の式がかければ、観測数と生起確率の極限を取れればポアソン分布を導出できる。

5. ポアソン分布と指数分布の関係を説明

確率分布に関する雑談で人気。ポアソン分布と指数分布の平均値を導出できれば終了。ポアソン分布と指数分布の定義を思い出せるかがポイントになる。

6. ガウス積分の証明

情報系大学院の院試で出題されているのを見たことがあるのだが、文系学部の微分積分のテキストにも載っている。挟み撃ちを使った[-∞ ∞]の定積分の証明。なお、挟む辺を極座標に変換してから積分をするから、ヤコビアンも出てくる*2

7. 正規分布の導出

もっとも頻出の分布だが、入門レベルの教科書では導出はまずされない。ガウスの公理から、初歩的な微分方程式とガウス積分を使って導出することができる。ガウスの公理が思い出せない。

8. ガンマ関数とベータ関数の関係式の導出

ガンマ関数とベータ関数の定義が思い出せ、ルベーグ積分が使えれば簡単にできる。使えないと、ちょっと苦しい事になる。ベータ関数の引数が1/2以上のケースだけ考えると、だいぶ楽になるかも知れない。

9. χ二乗分布の導出

経済学研究科の統計学コンプ(博士課程進学試験)で頻出だった気がする問題。置換積分とガンマ関数とベータ関数の知識があれば作業ではあるが、よくお世話になるので挨拶代わりに確認しておくとよい。

10. t分布の導出

平均値の差の検定などでもっともお世話になるt検定。それの前提となるt分布は正規分布とχ二乗分布の同時確率分布なので、重積分の変数変換が分かれば導出できる。

11. F分布の導出

分散分析もよく使うが、それの前提となるF分布は二つのχ二乗分布の同時確率分布なので、二重積分の基数変換が分かれば導出できる。

12. マルコフの不等式の証明

積分の知識があれば簡単に証明できるが、トカレフの不等式と言ってしまい恥をかくときがある。

13. チェビシェフの不等式の証明

|a|以上の|x-μ|が出る確率も、a2以上の|x-μ|2が出る確率も同じことに気づけば、マルコフの不等式から簡単に導出できる。

14. 大数の弱法則の証明

統計ユーザー以外にも広く雑に知られる大数の法則。チェビシェフの不等式から、観測数が増大したときに期待値以外の平均値が出る確率が0に漸近することを示す事ができる。

15. 標本分布の母集団分布への分布収束の証明

標本分布は母集団分布に分布収束するのだが、単関数と大数の弱法則からそれを証明できる。中心極限定理を使うと違う話になるので注意。

16. テイラーの定理の証明

証明方法は幾つもあって何でも良いのだが、ロルの定理を使ったものが人気である。使うならばロルの定理は証明する。最大値・最小値定理まで遡って証明するのは苦労だが、これは自明として良い。多変量のバージョンの方も流れは同じ。変数が幾つかの範囲であれば合成関数の微分でも頑張れる。

17. 二項定理の証明

フェルマーの小定理の証明など何かと使う(x + y)pの展開がどうなるか示す二項定理。コンビネーションの定義と数学的帰納法が思い出せれば難しくは無い。

18. ワイエルシュトラスの多項式近似定理の証明

有限区間の任意の連続関数は、次数を増やす事で任意の精度で多項式で近似できると言う定理。二項定理の応用だが、ε-δ論法にもなっているので難易度は高めかも知れない。

19. モーメント母関数の一意性の証明

天下り式に確率分布とモーメント母関数が一対一と説明しているテキストが多い。そう疑問を持たれる部分でも無いであろうが、ワイエルシュトラスの多項式近似定理を使うと短く証明できる*3

20. 中心極限定理の証明

平均ゼロ、分散1に正規化した独立で同一の確率変数n個の和のモーメント母関数の導出をすると、モーメント母関数の一意性から、平均と分散がある確率分布からの標本平均の分布が、正規分布に漸近することが分かる。

まとめ

トピック自体は学部で最初に使う教科書の範囲、確率・統計の講義の期末試験に出るようなものがほとんどで、ネットで検索すれば模範解答が見つかる。いつぞやか勉強した記憶があるぐらいの人が大多数でろう。しかし、全部をそらで説明できる人はそんなにいないと思う。

もちろん網羅にはほど遠い。例えば行列で線形回帰の係数と標準誤差の導出したり*4、主成分分析とからめて正方行列が対角化できる条件と理由を説明したり、数値解法の初歩的な技法としてニュートン・ラフソン法の収束条件の説明をしたりできる方が望ましい。

統計学を使って何かを分析するのに本当に必要な知識なのかとか、私がこれらを解けるのかなどはわざわざ聞かないように(´・ω・`)ショボーン

*1数学徒にとっては暗算なので、意味がないそうです(;´Д`)ハァハァ

*2ヤコビアンが出てくるわけで厳密にはベクトル解析の知識が要求されるが、数学徒で無ければ、そこは労力的な理由で天下り式に受け入れても良いと思う(関連記事:導関数dy/dxのdyとdxを説明するのは実は苦労)。

*3モーメント母関数は実際、区分的に連続なラプラス変換なので自明とされることが多いようだが、当たり前だがラプラス変換の一意性を示す証明と同様に、基数変換で有限閉区間の積分にすることで証明できる。

*4微分積分と線形代数の知識が要求されるが、頭のよい名門大学では学部でも教えている模様。

0 コメント:

コメントを投稿