
目的
通過Kaggle的HR數據集分析身邊的小伙伴們為什么要離職,并基于數據集中的特征制定一個評分卡模型來預測會不會離職。
數據集解釋
總覽:該HR數據集收集了15000份數據,其中3571人離職,離職率23.8%。
satisfaction_level :對公司的滿意程度
last_evaluation :對公司的評價
number_project :做過項目的數量
average_montly_hours :每月工作時長
time_spend_company :每天在公司的時間
Work_accident :工作差錯
promotion_last_5years :五年內有沒有提升
sales :職業
salary :薪資
left :是否離職
單變量分析
1. 工作差錯
零差錯員工離職率高于有差錯員工;
職場上大部分人(85.54%)沒有發生過工作差錯。從側面可以推斷,零差錯員工相對工作能力強,因此這部分人遇到能力與薪資不匹配的境遇更多,導致跳槽幾率升高。
2. 每月有效工作時長
工作時長介于163~200 h/month 的員工離職率低。以每月22個工作日計算,每日上班時長在7.4~9.1小時的員工離職率相對較低(不知道那些“996”的老板們是否看過這個數據)。因此,工作時間過長或過短,都有可能造成員工離職。
3. 離職前對公司的評價
對公司評價中上(0.6-0.78)員工的離職率遠遠低于對公司評價很高或很低的員工。那些對公司評價很高卻又離職的人,對公司的評價或許有言不由衷的成分吧,畢竟說自己老東家壞話的員工在哪里都不受歡迎。
4. 參與項目數量
參與項目數量為3到4個項目的人離職意愿非常低;
只參與2個項目及以下的員工則相對非常想離職。這也很好理解,到現在才做過兩個項目,要么是受排擠,要么是能力不被認可,還是跳槽迎接新挑戰吧;
參與5個及以上項目的人也想離職意向也偏高。或許是因為做過這么多項目了,應該是老員工,很多企業中,老員工能力增長的比薪資快很多,此處不留爺,自有留爺處!
5. 五年內有沒有提升
結果情理之中,意料之內,五年都沒提升,肯定想離職啊!
6. 對公司的滿意程度
先說一個非常智障的結果,對公司評價滿分的1362個人中,無一人離職。對公司評價接近于零分的人中,離職率很高;
對公司評價中上(0.5-0.72)的員工離職率很低;
對公司評價很高的員工離職率也不低。我認為有兩點原因,第一,這些人有些事真認為公司很好,他們是被迫離職,不是主動離職;第二,這部分人有些人十分隱忍謹慎,雖然對公司不滿,雖然是匿名填寫,他們還是不敢吐露真言。
7. 每天在公司的時間
每天只在公司待兩個小時的不愿意離職,這部分人要么是高管,要么是尸位素餐,所以不愿意離職;
在公司待五個小時的員工離職率很高,這部分人應該是銷售員或者是體力勞動者,他們在公司需要工作五小時,在外面可能還要工作5小時。
8. 薪資
這樣的結論真的是太不意外了,工資低當然想跳槽了。
9. 職業
令人很意外的是,HR這個職業離職率高于其他職業,可能是,哪個公司都需要HR吧;
management的離職率則相對偏低,可能是因為這部分人已經在某一領域具備了一定專業水平和業務能力,因而在公司發展空間相對可預見。
決策樹
對離職率影響最大的因素是員工對公司的評價和每天在公司的時間。
評分卡模型
用邏輯回歸對各個特征的woe值進行逐步回歸可得到評分卡模型(建模代碼太長,不一一貼出了)
注:得分越低,離職概率越大
總結
對離職率影響最大的因素是員工對公司的評價和每天在公司的時間;
HR可根據評分卡為公司職員做一次問卷調查,最后通過計算評分知曉各職員的離職意愿;
雖然很難改變員工對公司的評價,但是CEO可酌情給員工更多的辦公自由來減少離職率。