2017年9月28日木曜日

大抵のSNS上の「母数」は、単なる「数」に置き換えた方が正しくなる

このエントリーをはてなブックマークに追加
Pocket

統計学の用語で最も濫用されているのは、母数(パラメーター)であろう*1。母集団の確率分布を特徴付ける数で、平均や分散が該当するのだが、なぜか単なる数もしくは分母の意味で使われることが多い。いまさら言っても始まらないぐらい濫用されているのだが、用語の濫用はミスコミュニケーションの元なので、なるべく正しく使っていただきたい。

大抵のケースでは、「母数」の代わりに単なる「数」を使うべきである。

  1. 「母数をふやしたいからリツイートしてくれると嬉しい」というようなTwitterの投票で良くみかける文では、投票数
  2. 「母数が多いから悪い人も多い」や『母数が少なくて「確率が分からない」 』は、観測数
  3. 「母数を増やせばバラツキはある程度緩和されるはずだ」は、試行回数

「数」で置き換えると不自然なものもある。「割合の母数はn件」は「割合は総数n件に対しての値」にしよう。「母数全体を対象の数字順に並べて」は、数でも意味は通らなくもないが、観測値と言い換えるべきであろう。「ジャンルの母数が大きくなった時に」は、文脈から裾野と言い換えた方が良さそうだ。

漢字一文字だと締まらないと思うときは、回答数、試行回数、就業者数などの具体性を持たせた表現を考えよう。適切な用語を探す事で、思考が洗練される面もあるから、無駄にはならない。なお、日常的に確率分布の特徴をカテゴライズした概念を用いる事はないので、統計学の話をしていない限りは母数と言う表現は誤用になる。

*1有意も濫用されている気がするが、有意の方は統計学がsignificantを取り入れたらしいので、きっちりとした統計の話をしたときでないと誤用とは言えない。

0 コメント:

コメントを投稿