1. HOME
  2. ブログ
  3. IT技術
  4. 【Python】NumPyを使って「面接時の人事評価」と「仕事の出来」を相関係数で考えてみた

【Python】NumPyを使って「面接時の人事評価」と「仕事の出来」を相関係数で考えてみた

Numpy で面接時の人事評価と その後の仕事の出来の関係を見る

仕事ができる人を予測するための「良い指標」とは何でしょか。

考えられる1つの指標が、就職面接時の人事評価です。

就職面接時の人事評価が高ければ、その後の仕事の出来が良いことが予想されます。

実際にはそうはうまくいかない事も

しかし、就職面接時の人事評価と、その後の仕事の出来は相関関係にないことが頻繁にあります。

ときに、この事で「人事評価がうまくいっていない!」と判断する人も多いようです。

面接時の人事評価と、仕事の出来に相関関係がなければ、人事部に文句を言いたくなりますよね…。

相関関係が消失してしまっている可能性

しかし、これには「選抜効果」と呼ばれる、統計的な現象が生じているがゆえに、本来存在したはずの相関関係が消失してしまっている可能性があります。

そこで、今回は「選抜効果とは何か」を説明したいと思います。

さらに「なぜ就職面接時の人事評価とその後の仕事の出来は相関関係にないことが多いのか」も併せて解説します!

こちらの記事もオススメ!

選抜効果を相関関係で説明してみる

「選抜効果」とはなんでしょうか?

簡単にいいますと

データをある基準で「選抜」した際に、選抜する前のデータの統計量と、選抜後のデータの統計量が変化してしまうこと

を指します。

相関関係を例に説明してみる

では、今回は、その統計量として「相関係数」を例にとって説明します。

具体的なデータを使って考えていきましょう。

データの準備

まず、今回使用するデータを用意します。

使用するデータは、乱数を用いて作成しました。

data は、ある会社の就職面接を受けた人のデータとしましょう。

ここには、変数 Ability と  Performance があります。

data.head() で中身を確認

data.head() で中身を確認すると下記のようになっています。

Ability は「面接時の人事評価」、 Performance は「仕事の出来を表す指標」と解釈しましょう。

この指標が大きければ大きいほど、人事評価および仕事の出来が良いとします。

AbilityPerformance
042.61059456.448498
135.59483836.834103
247.14389353.080216
349.44193555.748134
455.59980549.419616

選抜前の相関関係

ここでのポイントは、就職面接時の人事評価は、採用者に対しても、不採用者に対しても行っているという点です。

つまり、不採用者の中にも、下記のようにグラデーションがあると考えられます。

  1. 人事評価は高いが、ぎりぎり採用されなかった人
  2. 人事評価がとても低くて、採用できなかった人

仮定してみる

仮想的にですが、「面接時の人事評価と仕事の出来の関係を、就職面接を受けた者全員において考えることができる」としましょう。

現実ではあり得ないですが、仮に「不採用者も就職し、その会社で一定の仕事を行った」という仮定を置いています。

そのような情報が、  data には含まれているとします。

その仮定のもとで、  AbilityPerformance の相関関係を確認しましょう。

Ability と Performance の相関関係

これは、「面接時の人事評価」と「仕事の出来の関係」を、就職面接を受けた者全員において考えていると解釈できます。

その相関関係は、以下のようになります。

相関係数は「0.722」です。

これをみれば、面接時の人事評価( Ability )が高ければ、仕事の出来(  Performance )が良いということが言えそうです。

つまり、人事評価が上手く機能していると言えます。

コード

ここで用いたコードは、下記のとおりです。

選抜後の相関関係

しかし現実は、ある一定の評価基準で採用・不採用が決定されます。

すなわち現実に観測できる関係は、ある基準で「選抜」されたデータにおける関係のみということになります。

先ほどの話は、あくまで仮想的な世界での話でした。

現実世界では「選抜」された採用者のデータしか入手できません。

dataを ある基準 で選抜し相関関係を見る

先ほどの内容を考慮して、 data をある基準で「選抜」します。

ここでは、人事評価( Ability )が70以上のデータを「選抜」することにします。

つまり、人事評価( Ability )が70以上の人を採用、それ未満の人を不採用とします。

相関関係

そうすると、その相関関係は以下の通りになります。

赤色のデータが「選抜」されたデータです。

繰り返しになりますが、現実ではこの赤色のデータしか観測できません

赤色のデータだけで相関係数を計算すると「0.236」となります。

赤色のデータのみを取り出した相関関係

念のため、赤色のデータのみを取り出した相関関係を確認しておきましょう。

これを見ると、面接時の人事評価( Ability )が高ければ、仕事の出来( Performance )が高いとは言えないことは明らかです。

つまり、仮想的な世界で確認された相関関係は現実の「選抜」されたデータでは消失してしまうのです。

コード

ここで用いたコードは、下記の通りです。

選抜効果のまとめ

以上の簡単な実験から分かるように、あるデータを何らかの基準で「選抜」すると、選抜する前のデータでの統計量と選抜後のデータでの統計量が変化してしまいます。

一般的に、選抜後の相関係数は、選抜前の相関係数よりも低くなることが知られています。

つまり、「採用・不採用」というように、何らかの基準で面接者を「選抜」しているがゆえに、「就職面接時の人事評価」と「その後の仕事の出来」との関係が消失してしまうのです。

人事評価がしっかりと行われているにも関わらずです。

本来「面接時の人事評価」は、その後の仕事の出来を予測する良い指標だったにも関わらず、「選抜」されたデータしか得られないがゆえに、その相関関係が消失してしまうのです。

結果的に、人事評価がうまく機能していないように見えるのです。

さいごに

今回は「相関係数」を例にとって「選抜効果」考えました。

就職面接では、採用者と不採用者を一定の基準で「選抜」しているがゆえに、もともとあった人事評価とその後の仕事の出来との間の相関関係が消失してしまいます。

つまり、現実世界で得られるデータは「選抜」されているがゆえに、本来の事象を見逃してしまう可能性があるのです。

このような現象は、大学入学試験のテストスコアと、大学入学後の成績との関係においても確認できます。

私たちは、仮想的な世界にも思いを馳せながら、現実のデータを読み解く必要があるのではないでしょうか?

(株)ライトコードは、WEB・アプリ・ゲーム開発に強い、「好きを仕事にするエンジニア集団」です。
Pythonでのシステム開発依頼・お見積もりはこちらまでお願いします。
また、Pythonが得意なエンジニアを積極採用中です!詳しくはこちらをご覧ください。

※現在、多数のお問合せを頂いており、返信に、多少お時間を頂く場合がございます。

こちらの記事もオススメ!

ライトコードよりお知らせ

にゃんこ師匠にゃんこ師匠
システム開発のご相談やご依頼はこちら
ミツオカミツオカ
ライトコードの採用募集はこちら
にゃんこ師匠にゃんこ師匠
社長と一杯飲みながらお話してみたい方はこちら
ミツオカミツオカ
フリーランスエンジニア様の募集はこちら
にゃんこ師匠にゃんこ師匠
その他、お問い合わせはこちら
ミツオカミツオカ
   
お気軽にお問い合わせください!せっかくなので、別の記事もぜひ読んでいって下さいね!

一緒に働いてくれる仲間を募集しております!

ライトコードでは、仲間を募集しております!

当社のモットーは「好きなことを仕事にするエンジニア集団」「エンジニアによるエンジニアのための会社」。エンジニアであるあなたの「やってみたいこと」を全力で応援する会社です。

また、ライトコードは現在、急成長中!だからこそ、あなたにお任せしたいやりがいのあるお仕事は沢山あります。「コアメンバー」として活躍してくれる、あなたからのご応募をお待ちしております!

なお、ご応募の前に、「話しだけ聞いてみたい」「社内の雰囲気を知りたい」という方はこちらをご覧ください。

ライトコードでは一緒に働いていただける方を募集しております!

採用情報はこちら

関連記事