「クロス集計表を作るのは簡単だけれど、カイ二乗検定の説明になると難易度が数段上がってしまう」と言うツイートを見かけた。まさにその通りで、クロス表の独立性検定はよく見かける一方で、その説明は難しい。
クロス表は二種類の因子の組み合わせごとの度数をまとめた表のことで、独立性検定とは二種類の因子に相関が無いと言えるかを調べる方法だ。共変量を統制できないので効果的に利用できる場面は限られるが、入門レベルの教科書や学部の講義ではよく紹介されている。
インターネット上で話題になっている事件を、理論とデータをもとに社会科学的に分析。
「クロス集計表を作るのは簡単だけれど、カイ二乗検定の説明になると難易度が数段上がってしまう」と言うツイートを見かけた。まさにその通りで、クロス表の独立性検定はよく見かける一方で、その説明は難しい。
クロス表は二種類の因子の組み合わせごとの度数をまとめた表のことで、独立性検定とは二種類の因子に相関が無いと言えるかを調べる方法だ。共変量を統制できないので効果的に利用できる場面は限られるが、入門レベルの教科書や学部の講義ではよく紹介されている。
アファーマティブアクションなどDEI施策批判者で、英文雑誌に論文を載せてしまうNENENENE@研究氏が、「欧米先進国で「女子枠」「黒人枠」「地方出身者枠」のような選抜方式になっていないのはアファーマティブアクション(AA)は支援対象の中で最も恵まれた層が得をするという事実があるからです(Sowell,2004)」とツイートし、統計学と経済学の博士号を持つ大学教員のマクリン氏に、Sowell (2004)は事実を示したと言える論証を行っていないと批判されている(togetter)。
デジタル庁クラウドチームはモダンなシステム構築の手法としてIaCの利用を勧めている。しかし、これまた説明に具体性がなくよくないので役に立つのか疑問に思われている。
IaCは宣言型プログラミング言語でインフラストラクチャーのリソース配置を記す技術(e.g. terraform)の総称で、クラウド事業者のサービスやコンテナオーケストレーションツール(i.e. Kubernetes)にそのコードを書いたテキストファイルを読み込ませることで、クラウドの設定を行うことができる。
デジタル庁テックブログの「ガバメントクラウドにおけるモダン化の意味と定義」の説明がよろしくないので「それ何の役に立つの?」と言う反応が出てしまっているメッセージキュー(バッチ処理のイベントドリブン化)なのだが、困ったときに上手く使うと便利なので紹介しておきたい。
業務システムは、ウェブアプリなどのオンライントランザクション処理(OLTP)と、バッチ処理に大きく分かれる。OLTPでは入力してから3秒反応ないと利用者が困惑すると言われ、30秒から60秒以内で処理を完了しないと、だいたいのミドルウェアの標準設定でリクエスト・タイム・アウトになってしまう。一方、バッチ処理は原則として時間制限がない。
これまで名誉毀損で何回も問題になり、虚構を含めた情報を拡散させるなどしてクルド人への憎悪を煽っていると非難されている、ジャーナリストの石井孝明氏が出した埼玉県の外国人検挙率の数字を参照し、「リベラルや反差別を掲げる人々」は「統計的根拠に基づいて差別をすることを肯定するべきかどうか」「答えなければならない」と主張しだした人がいるのだが、その前に石井孝明氏の出した数字がミスリーディングなものでないか検討する必要があるので指摘したい。
デジタル庁クラウドチームがクラウドサービス上でオートスケールを動かすと言う観点でしか話をしないので、コンテナ化技術(Docker, Kubernetes)とオブジェクトストレージの有用性が疑われているようだ。しかし、オンプレミスなシステムでも、地方自治体のシステムでも、有用な面があるので指摘したい。