numpy在cs231n中的应用

2019 年 10 月 5 日
筆記

numpy在cs231n中的应用

0.作者的话1.访问数组2.broadcast机制3.np.bincount()4.np.argmax()5.联合求解6.求取精度7.作者的话

0.作者的话

本节将之前发的numpy在cs231n中的应用做一个简单的梳理，下面一起来看看，numpy的强大所在！

1.访问数组

普通访问

import numpy as np  a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])  print(a)  # 获取第3列所有数据  print(a[:,2])

输出：

[[ 1  2  3  4]   [ 5  6  7  8]   [ 9 10 11 12]]  [ 3  7 11]

整型数组访问

整型数组访问允许我们利用其它数组的数据构建一个新的数组，还是以上述的二维数组为例：

print(a[[0, 1, 2], [0, 1, 0]])

输出：

[1 6 9]

怎么得到的？

上述等价于

np.array生成一维度数组，一维数组的元素通过上述的普通法访问得到。

print(np.array([a[0, 0], a[1, 1], a[2, 0]]))

也就是说，上述a中为一个二维数组，实际上前后对应关系，然后按照普通访问方式获取即可!

除此之外，整型数组访问可以用来选择或者更改矩阵中每行中的一个元素！

仍然是以上述的二维数组为例：

b = np.array([0, 2, 1])  print(a[np.arange(3),b])

这个又该得到什么结果？

[ 1  7 10]

为什么?

np.arrange(3)得到0，1，2个数，每次取出其中一个元素进行访问，上述便转换为a[0，0]，a[1，2]，a[2，1] 分别为1 7 9 10，也就是上述输出的结果!

布尔型数组访问

布尔型数组访问可以选择数组中任意元素。

这种访问方式用于选取数组中满足某些条件的元素。

还是以上述二维数组为例：

我们筛选所有大于3的数，并输出。

bool_index = (a > 3)  print(bool_index)  print(a[bool_index])  print(a[a>3])

输出：

[[False False False  True]   [ True  True  True  True]   [ True  True  True  True]]  [ 4  5  6  7  8  9 10 11 12]  [ 4  5  6  7  8  9 10 11 12]

2.broadcast机制

numpy数组间的基础运算是一对一，也就是a.shape==b.shape，但是当两者不一样的时候，就会自动触发广播机制，如下例子：

from numpy import array  a = array([[ 0, 0, 0],             [10,10,10],             [20,20,20],             [30,30,30]])  b = array([0,1,2])  print(a+b)

输出：

[[ 0  1  2]   [10 11 12]   [20 21 22]   [30 31 32]]

为什么是这个样子？

这里以tile模拟上述操作，来回到a.shape==b.shape情况！

# 对[0,1,2]行重复3次，列重复1次  b = np.tile([0,1,2],(4,1))  print(a+b)

输出：

[[ 0  1  2]   [10 11 12]   [20 21 22]   [30 31 32]]

到这里，我们来给出一张图：

是不是任何情况都可以呢？

当然不是，只有当两个数组的trailing dimensions compatible时才会触发广播，否则报错ValueError: frames are not aligned exception。

上面表达意思是尾部维度必须兼容！

尾部维度：

将多维数组右对齐！能够上下对应，这部分就是尾部，而对应的头部维度，则是维度大的数组比维度小的数组多出来的维度！如下面实际例子：

             axis:   0     1   2  a      (3d array): 256 x 256 x 3  b      (2d array):       256 x 3  a + b  (2d array): 256 x 256 x 3

兼容

they are equal, or one of them is 1

兼容两层意思，深入研究，第一：they are equal

尾部维度相等！

             axis:   0     1   2  a      (3d array): 256 x 256 x 3  b      (2d array):       256 x 3  a + b  (2d array): 256 x 256 x 3

第二：one of them is 1

像下面这个尾部维度不等，但是a或者b对应的元素有1存在，那么也满足兼容性！

             axis:   0     1   2  a      (3d array): 256 x 256 x 1  b      (2d array):        1  x 3  a + b  (2d array): 256 x 256 x 3

也就是1可以和任意维度兼容！

广播失败：

             axis:   0     1   2  a1      (3d array): 256 x 256 x 1  b      (2d array):       220 x 3  a1 + b  ValueError

失败转化

             axis:   0     1   2   3  a2      (4d array): 256 x 256 x 1 x 1  b      (2d array):           220 x 3  a2 + b  (4d array): 256 x 256 x 220 x 3

我们看到在a2的第三个维度增加了一个1，扩充为4维，便可以正常广播！

如何实现a1到a2转化？

a2 = a1[:,:,np.newaxis,:]即可！

3.np.bincount()

首先生成一个一维数组

x = np.array([1, 2, 3, 3, 0, 1, 4])

统计索引出现次数：索引0出现1次，1出现2次，2出现1次，3出现2次，4出现1次

因此通过bincount计算出索引出现次数如下：

np.bincount(x)  # [1 2 1 2 1]

上面怎么得到的？

对于bincount计算吗，bin的数量比x中最大数多1，例如x最大为4，那么bin数量为5(index从0到4)，也就会bincount输出的一维数组为5个数，bincount中的数又代表什么？代表的是它的索引值在x中出现的次数！

还是以上述x为例子，当我们设置weights参数时候，结果又是什么？

这里假定：

w = np.array([0.3,0.5,0.7,0.6,0.1,-0.9,1])

那么设置这个w权重后，结果为多少？

np.bincount(x,weights=w)

输出：

[ 0.1 -0.6  0.5  1.3  1. ]

怎么计算的？

先对x与w抽取出来：

x --->  [1, 2, 3, 3, 0, 1, 4]  w --->  [0.3,0.5,0.7,0.6,0.1,-0.9,1]

索引 0 出现在x中index=4位置，那么在w中访问index=4的位置即可，w[4]=0.1 索引 1 出现在x中index=0与index=5位置，那么在w中访问index=0与index=5的位置即可，然后将两这个加和，计算得：w[0]+w[5]=-0.6 其余的按照上面的方法即可！

bincount的另外一个参数为minlength，这个参数简单，可以这么理解，当所给的bin数量多于实际从x中得到的bin数量后，后面没有访问到的设置为0即可。

还是上述x为例：

这里我们直接设置minlength=7参数，并输出！

[1 2 1 2 1 0 0]

与上面相比多了两个0，这两个怎么会多？

上面知道，这个bin数量为5，index从0到4，那么当minlength为7的时候，也就是总长为7，index从0到6，多了后面两位，直接补位为0即可！

4.np.argmax()

函数原型为：numpy.argmax(a, axis=None, out=None).

函数表示返回沿轴axis最大值的索引。

x = [[1,3,3],       [7,5,2]]  print(np.argmax(x))  # 3

对于这个例子我们知道，7最大，索引位置为3(这个索引按照递增顺序)！

axis属性

axis=0表示按列操作，也就是对比当前列，找出最大值的索引！

x = [[1,3,3],       [7,5,2]]  print(np.argmax(x,axis=0))  # [1 1 0]

axis=1表示按行操作，也就是对比当前行，找出最大值的索引！

x = [[1,3,3],       [7,5,2]]  print(np.argmax(x,axis=0))  # [1 0]

那如果碰到重复最大元素？

返回第一个最大值索引即可！

例如：

x = np.array([1, 3, 2, 3, 0, 1, 0])  print(x.argmax())  # 1

5.联合求解

这里来融合上述两个函数，举个例子：

x = np.array([1, 2, 3, 3, 0, 1, 4])  print(np.argmax(np.bincount(x)))

最终结果为1，为什么？

首先通过np.bincount(x)得到的结果是：[1 2 1 2 1]，再根据最后的遇到重复最大值项，则返回第一个最大值的index即可！2的index为1，所以返回1。

6.求取精度

取指定位置的精度

np.around([-0.6,1.2798,2.357,9.67,13], decimals=0)

Out

看到没，负数进位取绝对值大的！

array([-1.,  1.,  2., 10., 13.])

np.around([1.2798,2.357,9.67,13], decimals=1)

Out

array([ 1.3,  2.4,  9.7, 13. ])

np.around([1.2798,2.357,9.67,13], decimals=2)

Out

array([ 1.28,  2.36,  9.67, 13.  ])

从上面可以看出，decimals表示指定保留有效数的位数，当超过5就会进位(此时包含5)！

但是，如果这个参数设置为负数，又表示什么？

np.around([1,2,5,6,56], decimals=-1)

Out

array([ 0,  0,  0, 10, 60])

发现没，当超过5时候(不包含5)，才会进位！-1表示看一位数进位即可，那么如果改为-2呢，那就得看两位！

例如：

np.around([1,2,5,50,56,190], decimals=-2)

Out

array([  0,   0,   0,   0, 100, 200])

看到没，必须看两位，超过50才会进位，190的话，就看后面两位，后两位90超过50，进位，那么为200！

计算沿指定轴第N维的离散差值

x = np.arange(1 , 16).reshape((3 , 5))

Out

array([[ 1,  2,  3,  4,  5],         [ 6,  7,  8,  9, 10],         [11, 12, 13, 14, 15]])

np.diff(x,axis=1) #默认axis=1

Out

array([[1, 1, 1, 1],         [1, 1, 1, 1],         [1, 1, 1, 1]])

np.diff(x,axis=0)

Out

array([[5, 5, 5, 5, 5],         [5, 5, 5, 5, 5]])

取整

np.floor([-0.6,-1.4,-0.1,-1.8,0,1.4,1.7])

Out

array([-1., -2., -1., -2.,  0.,  1.,  1.])

看到没，负数取整，跟上述的around一样，是向左！

取上限

np.ceil([1.2,1.5,1.8,2.1,2.0,-0.5,-0.6,-0.3])

取上限！找这个小数的最大整数即可！

查找

利用np.where实现小于0的值用0填充吗，大于0的数不变！

x = np.array([[1, 0],         [2, -2],       [-2, 1]])

Out

array([[ 1,  0],         [ 2, -2],         [-2,  1]])

np.where(x>0,x,0)

Out

array([[1, 0],         [2, 0],         [0, 1]])