HR(人事)にいるデータサイエンスパパ

HR(人事)データを分析するデータサイエンティスト。日々のデータ周りのことを書きます!

Peeple Analyticsに活かすHR(人事)データの溜め方

はじめに

Peeple Analyticsにおいてデータは命なので、HR(人事)データのカテゴリーと、データの溜め方に関して整理しました。

HRデータは担当者によって、資料に使う記述統計から機械学習モデルの構築まで幅広く用途があるので、個人的には各担当者の使いやすさのバランスを重視してデータを管理していく方がいいかなと思います。

 

HRデータのカテゴリー一覧 

 

HRデータのカテゴリー
カテゴリー
データ例
採用データ
ES・資格・スキル・選考評価・職務経歴書
社員データ(固定)
性別・生年月日・学歴・適性検査
社員データ(変動)
年齢・婚姻歴・在籍期間・職種・職務内容・志向
勤怠データ
出退勤・遅刻・欠勤・有給休暇
組織データ
所属組織・組織人数・職種・上司・メンバー
育成/研修データ
研修種別・受講歴
行動データ
異動希望・面談歴・イベント参加歴・その他ログ
給与データ
給与・賞与・インセンティブ
評価データ
人事考課・査定・等級
退職データ
退職歴・退職理由・転職先
アルムナイデータ
(転職先での)評価/エンゲージメント

 

HRデータは定期的に変動するデータが多いので、履歴データとして溜めていく必要があります。データが不変か可変かどうかで保持するテーブルを変えていくといいです。


評価データや退職データはKPIになることが多く、統計的な分析や機械学習モデリングする際に目的変数としてよく使われます。いずれも過去データを用いて示唆を示すので、過去の事象が現在でも言えるものなのか、BIツールなどを活用し、時系列での変動を確認することが大切です。


最近ではセンサーデータを活用する事例もあり、HRデータの幅は広がっています。難しいですが、アラムナイデータも取得できるようになると、採用において強力なタレントプールになります。  

 

HRデータの溜め方

HRデータは各社で導入しているシステムやデータの保管状況により、扱えるデータは各社で割と色が出ると思います。


収集コストの高いデータもあるので、解決したい課題に合わせて、データを集めていくのが良いかなと思います。過去データの収集はテクノロジーでも解決できない部分が多いので、かなりの気合いが必要です笑 それと合わせて自然とデータが溜まっていく仕組みを作るのはHR担当者の腕の見せ所ではないでしょうか。


私の会社では分析基盤として、HRデータの分析専用のデータベースを構築しています。
RDBMSで一括管理しており、手早く分析できるように数値変換した状態でデータベースに保存するようにしています。(データ活用にそこまで強くない担当者でもすぐに活用できることを優先して、DB設計は第二正規化までにしています。)

 

Excelで管理する会社も多いですが、データが各所に散在してしまうので、絶対的なデータとして分析用のデータベースを構築するのはおすすめです。(SQLはある程度書けるようにならなくてはいけませんが。)

 

最近では割とデータ量が多くなってきたので(ビッグデータと呼べるほどでは全くないですが)、専任のデータエンジニアがいてくれると嬉しいと思っています笑