2019年1月21日月曜日

毎月勤労統計の500人以上の事業所の全数調査をサンプリング調査に変えると、どの程度、精度が落ちるのか?

このエントリーをはてなブックマークに追加
Pocket

毎月勤労統計に関して500人以上の事業所に関して全数調査をサンプル調査に切り替えても適切に統計処理をすれば十分な精度が得られるという大阪大学の大竹文雄氏の主張*1に、東北大学の田中重人氏が「2003年の時点で「きまって支給する給与」平均値の1%の増減を識別できなくなっていたことは『毎月勤労統計要覧』チェックすればすぐわかる」から「嘘だ」と批判している。しかし、そんなに精度が落ちる理屈は無さそうなので記しておきたい。

田中重人氏の主張は、(1)現在でも十分な精度が得られていない、(2)サンプル調査に切り替えると精度が大きく落ちるの二つに整理することができると思うが、両方とも可能性が低いように思える。

要求次第なのだが、0.5%ポイントの変動を捉えるには十分な精度はある。主な利用目的の一番目にある失業保険の給付額の算定には『年度の平均給与額(毎月勤労統計調査における4月から翌年3月までの平均定期給与額の(単純)平均値』を使っている。「2003年に標本誤差率が過去最高 (0.65) 」の標準誤差を2倍にしたら1%ポイントを超えると言うことなのだが、これは7月単月分であり、12ヶ月分で考えれば標準誤差はずっと低下する。12ヶ月連続で0.65であれば、0.19とみなせることになる。もちろん計量分析に使うことを考えれば、精度は高ければ高い方が望ましいのだが、そう我侭を言うと世間様の視線が冷たくなる。

サンプル調査に切り替えると精度が大きく落ちる理屈も無いように思える。毎月勤労統計全体は労働者数ウェイトを用いた層化サンプリングになっているのだが、500人以上の事業所に勤める労働者数の比率はそう大きなものではない。毎月勤労統計の母集団の説明を見ると、12%弱となっている*2。標本分散を計算するときのウェイトは母集団の副標本の要素数を使うわけだが、500人以上の事業所の標準誤差が標本全体の標準誤差に与える影響は小さい*3。さすがに小規模事業所の何倍も、大規模事業所の給与水準が動くことは無いであろう。

一応、題名にそって具体的な想定を立てて計算をしてみた。母集団と標本の説明が見つけられなかったので、母集団56,872,826人、500人以上の事業所に勤める人を6,800,220、それ以外を50,072,606人として、前者を全数、後者の0.44%*4をサンプリングしたときの分散と、前者の1/3、後者の0.44%をサンプリングしたときの分散を比較してみたのだが、前者と後者の標本分散比が1のときは全体の標本分散が1.001221倍になった。大規模な事業所の給与水準のばらつきがその他と10倍ぐらい違えば*5、標準誤差を0.6%引き上げることになる*6

こういうわけで、毎月勤労統計の500人以上の事業所の全数調査をサンプリング調査に変えることに問題は無いように思える。なお、本当に毎月勤労統計の標誤差は標誤差を意味するのかなど用語上の謎や、サブサンプルの標本誤差率それぞれに有限母集団の修正がかかっているのか謎だったりする*7のだが、どちらに転んでも議論は揺るがない。もちろん実際にサンプリング調査に切り替えるのであれば、階層化をやり直すことになるだろうし、全数調査のデータをサンプリングするなどして、どれぐらい精度が落ちるかバイアスが入らないか試してみるなどした方がよいと思うが。あ、昔のデータ、捨てちゃったんだっけ?

*1毎月勤労統計の問題について|大竹文雄|note

*2母集団に関する資料が見つからなかったので「毎月勤労統計におけるローテーション・サンプリング(部分入替え方式)の導入に伴う対応について」の「ウエイトとする平成30年1月の常用労働者数(事業所規模別)」を参照した。

なお「平成28年経済センサス」の「結果の概要」の表Ⅲ-6に近い数字を目指した。

*3次の層化抽出の節を参照:美添(2000)「標本調査法の基礎理論—その1」青山経済論集,pp.117—149

*40.044%は500人未満の事業所の平均従業員数が10人を仮定している。最初、500人未満の事業所の平均従業員数が250人を仮定して11.4%にしたのだが、ちょっと多すぎたので変更した。

*5事業所単位で数字は出るので、一定人数分の平均賃金を、500人以上の規模の事業所から得る場合と、500人未満の規模の事業所から得る場合では、やはりボラティリティに差が出る。よって、10倍から100倍ぐらいは見たほうがよいかも知れないが、この程度では標準誤差を大きく左右しない。

*6美添(2000)の式(23)に仮定をあてはめてみた。

*7調査結果の精度」を見ると、第一種事業所(規模30人以上)は補正されている。

0 コメント:

コメントを投稿