2018年2月21日水曜日

人工知能に採用判断を一任すべきでは無い真の理由

このエントリーをはてなブックマークに追加
Pocket

ちょっと前に『採用選考に「AI」を導入しようとしたが、断念した会社の話が面白かった。』と言うエントリーが話題になっていた。ブログ主は医者であってエンジニア等ではないから仕方が無いのだが、ちょっと誤解があると言うか、人工知能に採用判断を、少なくとも一任すべきでは無い真の理由が見落とされていた。それは、人工知能が「なぜこの人を選んだのか。なぜこの人を選ばなかったのか」を説明できないからではない。

1. 機械学習の判断理由を見ることもできる

人工知能と言っても色々とあるのだが、最近の流行は教師つき機械学習なので、この事例においてもそれを使っているであろう。そして、機械学習では(ここでは採用不採用を決定する)分類器を構成する事ができるのだが、分類器がどういう特徴を持っているのかは、把握し難いところがある。しかし、把握する方法が無いわけでは無いし、そもそも把握する必要は無いかも知れない。

機械学習の分類器は最終的に0から1までの確率をスコアとして計算して、そのスコアの大小で判断を行っている。古典的なロジスティック回帰やプロビット回帰を用いれば、学歴にしろ、職歴にしろ、それがどの程度、スコアに反映されるのかは、平均値における限界効果の計算などによって評価する事ができる。ディープラーニングのような複雑怪奇なアルゴリズムの場合でも、モデル・ケースと幾つか作れば、だいたいの傾向は把握できるであろう。

そもそも論で、分類器の癖を把握する必要はないかも知れない。過去の採用担当者の判断を教師データとして用いる場合、採用担当者の基準を模倣しているだけなので、採用担当者の選考基準の真似でしか無いからだ。採用担当者が明確に基準を持っておらず感覚で決めていたり、採用後の実績でこの人は採用してよかった/しない方がよかったと言う教師データを作ったのであれば、分類器のパラメーターをよく検討したくなるかも知れないが。

2. 応募や採用があるので、一つの職場にあるデータだけでは偏る

ところで、人工知能に採用判断を一任すべきでは無い。入社後の成績や離職率で採用の可否を決める場合が特にそうなのだが、応募してこなかった、採用をしなかったタイプの属性のパフォーマンス情報が不足するので、分類器の構成が偏る可能性が高いからだ。学習データに無い属性を持った人間がやってきたら人工知能は評価できないし、職場で一人しかいない珍しい属性で、その一人の成績が悪い場合は、その属性の応募者を全て弾き出す可能性もある。また、過去と同じやり方で業務を行なわない場合は、過去に最適化されすぎの選考では問題が出る。

学歴や職歴などを指標化する方法もあるが、指標化の段階で恣意性が入る。学歴や職歴などではなく、客観テストの情報だけで判断すれば・・・と状況を絞ればよいかも知れないが、そうすると有効な情報を失う事になる。有名企業では学歴とパフォーマンスに相関が無かったと言う話がたまに流れるが、有名企業に入れるのは高学歴か他社で異常に実績を上げた例外だけなので、あれもそもそも分析に無理がある。将棋や囲碁であれば学習データを自己生成できるので、原理的にはバイアスに悩まされる事は無いのだが、人事データはそうはいかない。

3. 統計学からはじめる方が上手く使えるかも知れない

無論、道具なので使い様。採用担当者に数百ぐらいの教師データを作らせ分類器を構成し、一次選考に用いるぐらいであれば良いと思うし数万人の新卒応募者がいるような大企業では威力を発揮するであろう。

最初にあげたエントリーの採用担当者は、どういう性質の道具かを知りたかったのだと思うが、技術担当者がうまく考えを汲み上げられなかったのであろう。広告効果のように理屈抜きに結果を求めるときはともかく、どのような道具なのか模索段階では、ロジスティック回帰のような単純なモデルから人工知能/機械学習を導入する方が良いと思う。

企業の採用担当者に必要なのは、ディープラーニングでも機械学習でも人工知能でもなく統計学と言う話にはなるが、統計的予測と人工知能/機械学習の間の相違はそう大きなモノではない。

0 コメント:

コメントを投稿