Excel處理數據的小技巧(附python/不定時更新)

  • 2020 年 5 月 31 日
  • AI

從放假到現在 四個多月了 寒假的商業智慧下的精準預測,從交通量預測、到kaggle上的沃爾瑪銷售額的預測、再到福州K米銷售量的預測,小李還在做數據分析,數據預測,當然要完成這些首先要處理好數據。於是分享一些可以直接用excel就處理數據的技巧,當然也可以用python。

Q1:Excel如何導入數據(txt文本的格式)並存為csv格式文件?
A1:導入數據:點擊上方按鈕 文件→打開(選擇txt文件)
之後會跳出如下的框框

選擇下一步(也可以打開高級為文本分配類型)
接下來下一步的框(重點來啦),根據原本txt的文件之間的分隔選擇適合的分隔符號(我這邊的數據選擇是「|」號,故在其他中填入),再按下一步文件就順利導入了。

A2:保存為csv文件,直接選擇文件另存為然後選擇csv格式即可。這邊也可以用python操作,程式碼如下:

import pandas as pd  
 txt = np.loadtxt('file.txt')  
txtDF = pd.DataFrame(txt)  
txtDF.to_csv('file.csv',index=False)  

Q2:如何在excel文件中模糊查找和替換?
A1:模糊查找,也就是局部查找,就比如說你需要找出所有帶”酒”字數據,可以這樣操作,首先ctrl+F 跳出查找框,在查找內容中輸入兩個星號(如下圖所示)即可,而相應的替換操作也是如此

python程式碼(查找關鍵字並替換)
參考://cn.voidcc.com/question/p-pulthyrt-bm.html
//www.jb51.net/article/141245.htm

Q3:如何刪除excel中某個單元格中數據的末尾只保留一部分?(即保留單元格的前綴或後綴)
A1:首先,可以利用函數Left(B2,len(B2)-1),這個式子是left()的應用變形,即第一部分填入所需要保留的單元格,第二部分即該單元格的末尾減掉幾個字元,len()為長度
舉個例子,如下所示,需要保留前一部分的日期,則只需要輸入該公式即可

當然,接下來介紹更簡潔的方法
如果只想保留前綴或者後綴,可以輕鬆使用left()和right()兩個函數,比如right(A1,10),即保存右邊即後綴10個字元

Q4:如何將第一行的公式也應用整列?即如何用所需數據填入列的空值?
A1:先介紹第一種方法,適用於較少的數據集,即複製第一行的公式粘貼到最後一行,然後按住ctrl+shit+↑,之後回車鍵就可以將公式複製成功
A2:但第一種方法對於數據量較大的文件處理需要花更多的時間,昨天解鎖了定位空值的小技巧,先將第一行的公式複製好,然後ctrl+f,打開最右的定位,選擇空值

點擊定位後,所在列的空值會變成灰色,之後將複製的公式粘貼,再按ctrl+enter即可,如下圖所示,完成填充,格式均為第一個公式一樣保留了後綴


Ending~不定期更新結束,下次有空再整理一波python處理csv文件吧!
五月結束,六月見!