Numpy實戰全集
- 2019 年 10 月 5 日
- 筆記

Numpy實戰全集
0.導語1.Numpy基本操作1.1 列錶轉為矩陣1.2 維度1.3 行數和列數()1.4 元素個數2.Numpy創建array2.1 一維array創建2.1 多維array創建2.2 創建全零數組2.3 創建全一數據2.4 創建全空數組2.5 創建連續數組2.6 reshape操作2.7 創建連續型數據2.8 linspace的reshape操作3.Numpy基本運算3.1 一維矩陣運算3.2 多維矩陣運算3.3 基本計算4.Numpy索引與切片5.Numpy array合併5.1 數組合併5.2 數組轉置為矩陣5.3 多個矩陣合併5.4 合併例子26.Numpy array分割6.1 構造3行4列矩陣6.2 等量分割6.3 不等量分割6.4 其他的分割方式7.Numpy copy與 =7.1 =賦值方式會帶有關聯性7.2 copy()賦值方式沒有關聯性8.廣播機制9.常用函數
0.導語
好久沒來長文了,今天來一篇年終程式碼長文,大家都知道numpy多麼重要,那麼看完這一篇你將學到numpy的基本常用操作,下面一起來看吧,如果你覺得本公眾號對您有幫助,歡迎轉發支援,謝謝!!!
1.Numpy基本操作
1.1 列錶轉為矩陣
import numpy as np array = np.array([ [1,3,5], [4,6,9] ]) print(array)
輸出:
[[1 3 5] [4 6 9]]
1.2 維度
print('number of dim:', array.ndim)
輸出:
number of dim: 2
1.3 行數和列數()
print('shape:',array.shape)
輸出:
shape: (2, 3)
1.4 元素個數
print('size:',array.size)
輸出:
size:6
2.Numpy創建array
2.1 一維array創建
import numpy as np # 一維array a = np.array([2,23,4], dtype=np.int32) # np.int默認為int32 print(a) print(a.dtype)
輸出:
[ 2 23 4] int32
2.1 多維array創建
# 多維array a = np.array([[2,3,4], [3,4,5]]) print(a) # 生成2行3列的矩陣
輸出:
[[2 3 4] [3 4 5]]
2.2 創建全零數組
a = np.zeros((3,4)) print(a) # 生成3行4列的全零矩陣
輸出:
[[0. 0. 0. 0.] [0. 0. 0. 0.] [0. 0. 0. 0.]]
2.3 創建全一數據
# 創建全一數據,同時指定數據類型 a = np.ones((3,4),dtype=np.int) print(a)
輸出:
[[1 1 1 1] [1 1 1 1] [1 1 1 1]]
2.4 創建全空數組
# 創建全空數組,其實每個值都是接近於零的數 a = np.empty((3,4)) print(a)
輸出:
[[0. 0. 0. 0.] [0. 0. 0. 0.] [0. 0. 0. 0.]]
2.5 創建連續數組
# 創建連續數組 a = np.arange(10,21,2) # 10-20的數據,步長為2 print(a)
輸出:
[10 12 14 16 18 20]
2.6 reshape操作
# 使用reshape改變上述數據的形狀 b = a.reshape((2,3)) print(b)
輸出:
[[10 12 14] [16 18 20]]
2.7 創建連續型數據
# 創建線段型數據 a = np.linspace(1,10,20) # 開始端1,結束端10,且分割成20個數據,生成線段 print(a)
輸出:
[ 1. 1.47368421 1.94736842 2.42105263 2.89473684 3.36842105 3.84210526 4.31578947 4.78947368 5.26315789 5.73684211 6.21052632 6.68421053 7.15789474 7.63157895 8.10526316 8.57894737 9.05263158 9.52631579 10. ]
2.8 linspace的reshape操作
# 同時也可以reshape b = a.reshape((5,4)) print(b)
輸出:
[[ 1. 1.47368421 1.94736842 2.42105263] [ 2.89473684 3.36842105 3.84210526 4.31578947] [ 4.78947368 5.26315789 5.73684211 6.21052632] [ 6.68421053 7.15789474 7.63157895 8.10526316] [ 8.57894737 9.05263158 9.52631579 10. ]]
3.Numpy基本運算
3.1 一維矩陣運算
import numpy as np # 一維矩陣運算 a = np.array([10,20,30,40]) b = np.arange(4) print(a,b) # [10 20 30 40] [0 1 2 3] c = a - b print(c) # [10 19 28 37] print(a*b) # 若用a.dot(b),則為各維之和 # [ 0 20 60 120] # 在Numpy中,想要求出矩陣中各個元素的乘方需要依賴雙星符號 **,以二次方舉例,即: c = b**2 print(c) # [0 1 4 9] # Numpy中具有很多的數學函數工具 c = np.sin(a) print(c) # [-0.54402111 0.91294525 -0.98803162 0.74511316] print(b<2) # [ True True False False] a = np.array([1,1,4,3]) b = np.arange(4) print(a==b) # [False True False True]
3.2 多維矩陣運算
a = np.array([[1,1],[0,1]]) b = np.arange(4).reshape((2,2)) print(a) ''' [[1 1] [0 1]] ''' print(b) ''' [[0 1] [2 3]] ''' # 多維度矩陣乘法 # 第一種乘法方式: c = a.dot(b) print(c) # 第二種乘法: c = np.dot(a,b) print(c) ''' [[2 4] [2 3]] ''' # 多維矩陣乘法不能直接使用'*'號 a = np.random.random((2,4)) print(np.sum(a)) # 3.657010765991042 print(np.min(a)) # 0.10936760904735132 print(np.max(a)) # 0.9476048882750654 print("a=",a) ''' a= [[0.16607436 0.94760489 0.59649117 0.22698245] [0.66494464 0.23447984 0.10936761 0.71106581]] ''' print("sum=",np.sum(a,axis=1)) # sum= [1.93715287 1.7198579 ] print("min=",np.min(a,axis=0)) # min= [0.16607436 0.23447984 0.10936761 0.22698245] print("max=",np.max(a,axis=1)) # max= [0.94760489 0.71106581] ''' 如果你需要對行或者列進行查找運算, 就需要在上述程式碼中為 axis 進行賦值。 當axis的值為0的時候,將會以列作為查找單元, 當axis的值為1的時候,將會以行作為查找單元。 '''
3.3 基本計算
import numpy as np A = np.arange(2,14).reshape((3,4)) print(A) # 最小元素索引 print(np.argmin(A)) # 0 # 最大元素索引 print(np.argmax(A)) # 11 # 求整個矩陣的均值 print(np.mean(A)) # 7.5 print(np.average(A)) # 7.5 print(A.mean()) # 7.5 # 中位數 print(np.median(A)) # 7.5 # 累加 print(np.cumsum(A)) # [ 2 5 9 14 20 27 35 44 54 65 77 90] # 累差運算 B = np.array([[3,5,9], [4,8,10]]) print(np.diff(B)) ''' [[2 4] [4 2]] ''' C = np.array([[0,5,9], [4,0,10]]) print(np.nonzero(B)) print(np.nonzero(C)) ''' # 將所有非零元素的行與列坐標分割開,重構成兩個分別關於行和列的矩陣 (array([0, 0, 0, 1, 1, 1], dtype=int64), array([0, 1, 2, 0, 1, 2], dtype=int64)) (array([0, 0, 1, 1], dtype=int64), array([1, 2, 0, 2], dtype=int64)) ''' # 仿照列表排序 A = np.arange(14,2,-1).reshape((3,4)) # -1表示反向遞減一個步長 print(A) ''' [[14 13 12 11] [10 9 8 7] [ 6 5 4 3]] ''' print(np.sort(A)) ''' # 只是對每行進行遞增排序 [[11 12 13 14] [ 7 8 9 10] [ 3 4 5 6]] ''' # 矩陣轉置 print(np.transpose(A)) ''' [[14 10 6] [13 9 5] [12 8 4] [11 7 3]] ''' print(A.T) ''' [[14 10 6] [13 9 5] [12 8 4] [11 7 3]] ''' print(A) print(np.clip(A,5,9)) ''' clip(Array,Array_min,Array_max) 將Array_min<X<Array_max X表示矩陣A中的數,如果滿足上述關係,則原數不變。 否則,如果X<Array_min,則將矩陣中X變為Array_min; 如果X>Array_max,則將矩陣中X變為Array_max. [[9 9 9 9] [9 9 8 7] [6 5 5 5]] '''
4.Numpy索引與切片
import numpy as np A = np.arange(3,15) print(A) # [ 3 4 5 6 7 8 9 10 11 12 13 14] print(A[3]) # 6 B = A.reshape(3,4) print(B) ''' [[ 3 4 5 6] [ 7 8 9 10] [11 12 13 14]] ''' print(B[2]) # [11 12 13 14] print(B[0][2]) # 5 print(B[0,2]) # 5 # list切片操作 print(B[1,1:3]) # [8 9] 1:3表示1-2不包含3 for row in B: print(row) ''' [3 4 5 6] [ 7 8 9 10] [11 12 13 14] ''' # 如果要列印列,則進行轉置即可 for column in B.T: print(column) ''' [ 3 7 11] [ 4 8 12] [ 5 9 13] [ 6 10 14] ''' # 多維轉一維 A = np.arange(3,15).reshape((3,4)) # print(A) print(A.flatten()) # flat是一個迭代器,本身是一個object屬性 for item in A.flat: print(item)
5.Numpy array合併
5.1 數組合併
import numpy as np A = np.array([1,1,1]) B = np.array([2,2,2]) print(np.vstack((A,B))) # vertical stack 上下合併,對括弧的兩個整體操作。 ''' [[1 1 1] [2 2 2]] ''' C = np.vstack((A,B)) print(C) print(A.shape,B.shape,C.shape) # (3,) (3,) (2, 3) # 從shape中看出A,B均為擁有3項的數組(數列) # horizontal stack左右合併 D = np.hstack((A,B)) print(D) # [1 1 1 2 2 2] print(A.shape,B.shape,D.shape) # (3,) (3,) (6,) # 對於A,B這種,為數組或數列,無法進行轉置,需要藉助其他函數進行轉置
5.2 數組轉置為矩陣
print(A[np.newaxis,:]) # [1 1 1]變為[[1 1 1]] print(A[np.newaxis,:].shape) # (3,)變為(1, 3) print(A[:,np.newaxis]) ''' [[1] [1] [1]] '''
5.3 多個矩陣合併
# concatenate的第一個例子 print("------------") print(A[:,np.newaxis].shape) # (3,1) A = A[:,np.newaxis] # 數組轉為矩陣 B = B[:,np.newaxis] # 數組轉為矩陣 # axis=0縱向合併 C = np.concatenate((A,B,B,A),axis=0) print(C) ''' [[1] [1] [1] [2] [2] [2] [2] [2] [2] [1] [1] [1]] ''' # axis=1橫向合併 C = np.concatenate((A,B),axis=1) print(C) ''' [[1 2] [1 2] [1 2]] '''
5.4 合併例子2
# concatenate的第二個例子 print("-------------") a = np.arange(8).reshape(2,4) b = np.arange(8).reshape(2,4) print(a) print(b) print("-------------") # axis=0多個矩陣縱向合併 c = np.concatenate((a,b),axis=0) print(c) # axis=1多個矩陣橫向合併 c = np.concatenate((a,b),axis=1) print(c) ''' [[0 1 2 3] [4 5 6 7] [0 1 2 3] [4 5 6 7]] [[0 1 2 3 0 1 2 3] [4 5 6 7 4 5 6 7]] '''
6.Numpy array分割
6.1 構造3行4列矩陣
import numpy as np A = np.arange(12).reshape((3,4)) print(A) ''' [[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 11]] '''
6.2 等量分割
# 等量分割 # 縱向分割同橫向合併的axis print(np.split(A, 2, axis=1)) ''' [array([[0, 1], [4, 5], [8, 9]]), array([[ 2, 3], [ 6, 7], [10, 11]])] ''' # 橫向分割同縱向合併的axis print(np.split(A,3,axis=0)) # [array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8, 9, 10, 11]])]
6.3 不等量分割
print(np.array_split(A,3,axis=1)) ''' [array([[0, 1], [4, 5], [8, 9]]), array([[ 2], [ 6], [10]]), array([[ 3], [ 7], [11]])] '''
6.4 其他的分割方式
# 橫向分割 print(np.vsplit(A,3)) # 等價於print(np.split(A,3,axis=0)) # [array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8, 9, 10, 11]])] # 縱向分割 print(np.hsplit(A,2)) # 等價於print(np.split(A,2,axis=1)) ''' [array([[0, 1], [4, 5], [8, 9]]), array([[ 2, 3], [ 6, 7], [10, 11]])] '''
7.Numpy copy與 =
7.1 =賦值方式會帶有關聯性
import numpy as np # `=`賦值方式會帶有關聯性 a = np.arange(4) print(a) # [0 1 2 3] b = a c = a d = b a[0] = 11 print(a) # [11 1 2 3] print(b) # [11 1 2 3] print(c) # [11 1 2 3] print(d) # [11 1 2 3] print(b is a) # True print(c is a) # True print(d is a) # True d[1:3] = [22,33] print(a) # [11 22 33 3] print(b) # [11 22 33 3] print(c) # [11 22 33 3]
7.2 copy()賦值方式沒有關聯性
a = np.arange(4) print(a) # [0 1 2 3] b =a.copy() # deep copy print(b) # [0 1 2 3] a[3] = 44 print(a) # [ 0 1 2 44] print(b) # [0 1 2 3] # 此時a與b已經沒有關聯
8.廣播機制
numpy數組間的基礎運算是一對一,也就是a.shape==b.shape,但是當兩者不一樣的時候,就會自動觸發廣播機制,如下例子:
from numpy import array a = array([[ 0, 0, 0], [10,10,10], [20,20,20], [30,30,30]]) b = array([0,1,2]) print(a+b)
輸出:
[[ 0 1 2] [10 11 12] [20 21 22] [30 31 32]]
為什麼是這個樣子?
這裡以tile
模擬上述操作,來回到a.shape==b.shape情況!
# 對[0,1,2]行重複3次,列重複1次 b = np.tile([0,1,2],(4,1)) print(a+b)
輸出:
[[ 0 1 2] [10 11 12] [20 21 22] [30 31 32]]
到這裡,我們來給出一張圖:

是不是任何情況都可以呢?
當然不是,只有當兩個數組的trailing dimensions compatible時才會觸發廣播,否則報錯ValueError: frames are not aligned exception
。
上面表達意思是尾部維度必須兼容!
尾部維度:
將多維數組右對齊!能夠上下對應,這部分就是尾部,而對應的頭部維度,則是維度大的數組比維度小的數組多出來的維度!如下面實際例子:
axis: 0 1 2 a (3d array): 256 x 256 x 3 b (2d array): 256 x 3 a + b (2d array): 256 x 256 x 3
兼容
they are equal, or one of them is 1
兼容兩層意思,深入研究,第一:they are equal
尾部維度相等!
axis: 0 1 2 a (3d array): 256 x 256 x 3 b (2d array): 256 x 3 a + b (2d array): 256 x 256 x 3
第二:one of them is 1
像下面這個尾部維度不等,但是a或者b對應的元素有1存在,那麼也滿足兼容性!
axis: 0 1 2 a (3d array): 256 x 256 x 1 b (2d array): 1 x 3 a + b (2d array): 256 x 256 x 3
也就是1可以和任意維度兼容!
廣播失敗:
axis: 0 1 2 a1 (3d array): 256 x 256 x 1 b (2d array): 220 x 3 a1 + b ValueError
失敗轉化
axis: 0 1 2 3 a2 (4d array): 256 x 256 x 1 x 1 b (2d array): 220 x 3 a2 + b (4d array): 256 x 256 x 220 x 3
我們看到在a2的第三個維度增加了一個1,擴充為4維,便可以正常廣播!
如何實現a1到a2轉化?
a2 = a1[:,:,np.newaxis,:]
即可!
9.常用函數
9.1 np.bincount()
首先生成一個一維數組
x = np.array([1, 2, 3, 3, 0, 1, 4])
統計索引出現次數:索引0出現1次,1出現2次,2出現1次,3出現2次,4出現1次
因此通過bincount計算出索引出現次數如下:
np.bincount(x) # [1 2 1 2 1]
上面怎麼得到的?
對於bincount計算嗎,bin的數量比x中最大數多1,例如x最大為4,那麼bin數量為5(index從0到4),也就會bincount輸出的一維數組為5個數,bincount中的數又代表什麼?代表的是它的索引值在x中出現的次數!
還是以上述x為例子,當我們設置weights參數時候,結果又是什麼?
這裡假定:
w = np.array([0.3,0.5,0.7,0.6,0.1,-0.9,1])
那麼設置這個w權重後,結果為多少?
np.bincount(x,weights=w)
輸出:
[ 0.1 -0.6 0.5 1.3 1. ]
怎麼計算的?
先對x與w抽取出來:
x ---> [1, 2, 3, 3, 0, 1, 4] w ---> [0.3,0.5,0.7,0.6,0.1,-0.9,1]
索引 0 出現在x中index=4位置,那麼在w中訪問index=4的位置即可,w[4]=0.1 索引 1 出現在x中index=0與index=5位置,那麼在w中訪問index=0與index=5的位置即可,然後將兩這個加和,計算得:w[0]+w[5]=-0.6 其餘的按照上面的方法即可!
bincount的另外一個參數為minlength,這個參數簡單,可以這麼理解,當所給的bin數量多於實際從x中得到的bin數量後,後面沒有訪問到的設置為0即可。
還是上述x為例:
這裡我們直接設置minlength=7參數,並輸出!
[1 2 1 2 1 0 0]
與上面相比多了兩個0,這兩個怎麼會多?
上面知道,這個bin數量為5,index從0到4,那麼當minlength為7的時候,也就是總長為7,index從0到6,多了後面兩位,直接補位為0即可!
9.2 np.argmax()
函數原型為:numpy.argmax(a, axis=None, out=None)
.
函數表示返回沿軸axis最大值的索引。
x = [[1,3,3], [7,5,2]] print(np.argmax(x)) # 3
對於這個例子我們知道,7最大,索引位置為3(這個索引按照遞增順序)!
axis屬性
axis=0表示按列操作,也就是對比當前列,找出最大值的索引!
x = [[1,3,3], [7,5,2]] print(np.argmax(x,axis=0)) # [1 1 0]
axis=1表示按行操作,也就是對比當前行,找出最大值的索引!
x = [[1,3,3], [7,5,2]] print(np.argmax(x,axis=0)) # [1 0]
那如果碰到重複最大元素?
返回第一個最大值索引即可!
例如:
x = np.array([1, 3, 2, 3, 0, 1, 0]) print(x.argmax()) # 1
9.3 上述合併實例
這裡來融合上述兩個函數,舉個例子:
x = np.array([1, 2, 3, 3, 0, 1, 4]) print(np.argmax(np.bincount(x)))
最終結果為1,為什麼?
首先通過np.bincount(x)得到的結果是:[1 2 1 2 1],再根據最後的遇到重複最大值項,則返回第一個最大值的index即可!2的index為1,所以返回1。
9.4 求取精度
取指定位置的精度
In
np.around([-0.6,1.2798,2.357,9.67,13], decimals=0)
Out
看到沒,負數進位取絕對值大的!
array([-1., 1., 2., 10., 13.])
In
np.around([1.2798,2.357,9.67,13], decimals=1)
Out
array([ 1.3, 2.4, 9.7, 13. ])
In
np.around([1.2798,2.357,9.67,13], decimals=2)
Out
array([ 1.28, 2.36, 9.67, 13. ])
從上面可以看出,decimals表示指定保留有效數的位數,當超過5就會進位(此時包含5)!
但是,如果這個參數設置為負數,又表示什麼?
In
np.around([1,2,5,6,56], decimals=-1)
Out
array([ 0, 0, 0, 10, 60])
發現沒,當超過5時候(不包含5),才會進位!-1表示看一位數進位即可,那麼如果改為-2呢,那就得看兩位!
例如:
In
np.around([1,2,5,50,56,190], decimals=-2)
Out
array([ 0, 0, 0, 0, 100, 200])
看到沒,必須看兩位,超過50才會進位,190的話,就看後面兩位,後兩位90超過50,進位,那麼為200!
計算沿指定軸第N維的離散差值
In
x = np.arange(1 , 16).reshape((3 , 5))
Out
array([[ 1, 2, 3, 4, 5], [ 6, 7, 8, 9, 10], [11, 12, 13, 14, 15]])
In
np.diff(x,axis=1) #默認axis=1
Out
array([[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]])
In
np.diff(x,axis=0)
Out
array([[5, 5, 5, 5, 5], [5, 5, 5, 5, 5]])
取整
In
np.floor([-0.6,-1.4,-0.1,-1.8,0,1.4,1.7])
Out
array([-1., -2., -1., -2., 0., 1., 1.])
看到沒,負數取整,跟上述的around一樣,是向左!
取上限
np.ceil([1.2,1.5,1.8,2.1,2.0,-0.5,-0.6,-0.3])
取上限!找這個小數的最大整數即可!
查找
利用np.where
實現小於0的值用0填充嗎,大於0的數不變!
In
x = np.array([[1, 0], [2, -2], [-2, 1]])
Out
array([[ 1, 0], [ 2, -2], [-2, 1]])
In
np.where(x>0,x,0)
Out
array([[1, 0], [2, 0], [0, 1]])