2013年7月23日火曜日

Pythonプログラマのための確率・統計入門書

このエントリーをはてなブックマークに追加
Clip to Evernote
Pocket

確率・統計が分からないプログラマ向けに良いのでは無いかと、オンラインでフリーで配布されている"Think Stats: Probability and Statistics for Programmers"が紹介されていた。内容が悪いわけではないが、誰が読めばいいのかと言う所がある本になっている。

Pythonと言う広く使われているプログラミング言語をターゲットにしているのは良いところだと思う。英文テキストだと別売と言う事もあるのだが、コードの例や問題の解答もフリーで配布されているのも評価できる。しかし、極端に基本的な内容で、Pythonに特化した中途半端な実践形式にする必要があったのであろうか?

入門本として考えた場合、事例が少ない。ポアソン分布が紹介されていないのは御愛嬌としても、どの分布がどういう時に当てはまるのかの説明や事例が薄いのが気になる所だ。カイ二乗検定は紹介されているが、t検定やF検定は紹介されていない。モーメント母関数も無い。逆にベイズ確率や最尤法に言及する必要があったのであろうか。

数学的証明は省かれている。確かに定番である中心極限定理やカイ二乗分布の導出がプログラマに必要かと言うと、そうでは無い気もする。しかし、単回帰の紹介で、唐突に切片項はこうなりますと書いてあって、「詳しくはウェブ(wikipedia)で」となっている。カイ二乗分布については、何を意味する分布なのかの説明も見当たらない。

プログラマだったら平均や分散のコーディングであれば、テキストを見れば即座にできるであろうし、実践的な統計解析パッケージの使い方の説明としたら重要な事が多く省かれている。そして、プログラミングを意識した場合に避けて通れないコンピューターのランダム関数の精度やバイアスの話は一切されていない。Pythonのrandom関数はメルセンヌ・ツイスタだから無視したのであろうか?

誰が何のために読むべきかが良く分からないテキストとなっている。あえて分類すると、レクチャー・ノート風味のところもあるので、プログラミングと確率・統計のどちらも初学者の人々に向けたテキストなのであろう。しかし実践で使うとすれば「統計学入門」ぐらいの内容は知っておくべきだし、内容に不足が目立つ。

0 コメント:

コメントを投稿