Python數據分析幫你清晰的了解整理員工們的工作效率和整體滿意度

2020 年 6 月 29 日
筆記
6月

前言

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。

項目背景

2018年，被稱為互聯網的寒冬之年。無論大小公司，紛紛走上了裁員之路，還有一些比較慘的，直接關門大吉。2019年上半年，甲骨文裁掉大量35歲左右的程式設計師，誰也沒想到，IT界退休年齡這麼早！而內心OS：我的房貸還沒還清。。。。

假設你是人力資源總監，你該向誰開刀呢？先回答一下下面的問題。

各部門有多少名員工？
員工總體流失率是多少？
員工平均薪資是多少？
員工平均工作年限是多少？
公司任職時間最久的3名員工是誰？
員工整體滿意度如何？

數據處理

import pandas as pd
data = pd.read_excel(r'c:\Users\Administrator\Desktop\英雄聯盟員工資訊表.xlsx',index_col = u'工號')
# 訪問columns屬性，查看列欄位
data.columns
# 訪問index屬性，查看行標記
data.index
# 訪問values屬性，查看數據集
data.values

# 對元數據集增加一列獎金列，數額為薪資的20%
data[u'獎金'] = data[u'薪資']*0.2
data[u'獎金'].head()
# loc方法，根據索引列訪問數據集
idx = ['lol-1','lol-2','lol-3','lol-7']
data.loc[idx]

# 對元數據集增加一列獎金列，數額為薪資的20%
data[u'獎金'] = data[u'薪資']*0.2
data[u'獎金'].head()
# loc方法，根據索引列訪問數據集
idx = ['lol-1','lol-2','lol-3','lol-7']
data.loc[idx]

此時，我們在上述結果中發現：寒冰、蓋倫是重複數據條，在數據分析過程中，一定要注意重複數據帶來的影響，所以我們要進行去重操作。

# 查看重複數據條（bool結果為True代表重複）
data.duplicated()
# 查看有多少條重複數據
data.duplicated().sum()    # 結果：2 
# 查看重複數據
data[data.duplicated()]
# 刪除重複數據條，inplace參數代表是否在元數據集進行刪除，True表示是
data.drop_duplicates(inplace=True)
# 再次查看是否全部去重
data.duplicated().sum()    # 結果：0，說明數據已經唯一

數據分析

1.各部門有多少名員工？

# 頻數統計
data[u'部門'].value_counts()
# ascending = True代表升序展示
data[u'部門'].value_counts(ascending = True)

2.員工總體流失率是多少？

# 頻數統計
data[u'狀態'].value_counts()
# normalize = True 獲得標準化計數結果
data[u'狀態'].value_counts(normalize = True)
# 展示出員工總體流失率
rate = data[u'狀態'].value_counts(normalize = True)[u'離職']
rate

3.員工平均薪資是多少？

由上圖的結果可以看出，平均薪資在16800元，你達到了嗎？！允許你去哭一會o(╥﹏╥)o！

4.公司任職時間最久的3名員工是誰？

# describe方法也是常用的一種方法，而且結果更全面。
data[u'工齡'].describe()
# 通過降序排序、切片操作，找到待的最久的三名員工
data[u'工齡'].sort_values(ascending = False)[:3]
ID = data[u'工齡'].sort_values(ascending = False)[:3].index
data.loc[ID]

6.員工整體滿意度如何？

data[u'滿意度'].head()
# 通過查看滿意度前五行發現，不太直觀，我們可以用map進行映射，先建立一個映射字典
JobSatisfaction_cat = {
    1:'非常滿意',
    2:'一般般吧',
    3:'勞資不爽'
}
data[u'滿意度'].map(JobSatisfaction_cat)
# 對元數據集進行滿意度映射
data[u'滿意度'] = data[u'滿意度'].map(JobSatisfaction_cat)
data[u'滿意度'].head()

接下來，進行員工整體滿意度分析。通過計算可以得出：70%員工都比較認可公司，但仍有30%員工對公司不滿意。人力主管以及部門主管需要進一步探究清楚這30%員工的情況，因為不滿意是否已經離職？還是存在隱患？是否處於核心崗位等等問題值得我們進一步探究。

data.head()
# 頻數統計
data[u'滿意度'].value_counts()
# 獲得標準化計數結果，考慮到百分比更能說明滿意度情況，所以乘100展示
100*data[u'滿意度'].value_counts(normalize = True)

Tags: 6月

Python數據分析幫你清晰的了解整理員工們的工作效率和整體滿意度

數據處理

數據分析

VirMach 便宜 VPS

QNews

Python數據分析幫你清晰的了解整理員工們的工作效率和整體滿意度

數據處理

數據分析

分享此文：

Related Posts

python影像處理-像素操作換背景(下)

測試方案

在線協作文檔巨頭林立，為什麼選擇「超級文檔」

iPhone 12不送充電器和耳機 李楠：考慮環保早該停止了

VirMach 便宜 VPS

QNews

熱門搜尋

iPhone 12不送充電器和耳機李楠：考慮環保早該停止了