【numpy】新版本中numpy(numpy>1.17.0)中的random模塊

numpy是Python中經常要使用的一個庫,而其中的random模塊經常用來生成一些數組,本文接下來將介紹numpy中random模塊的一些使用方法。

首先查看numpy的版本:

import numpy 
numpy.__version__

‘1.18.2’

numpy獲得隨機數有兩種方式:

  • 結合BitGenerator生成偽隨機數
  • 結合Generate從一些統計分佈中採樣生成偽隨機數

BitGenerator:生成隨機數的對象。包含32或64位序列的無符號整數

Generator:將從BitGenerator生成的隨機數序列轉換為遵從特定概率分佈(均勻、正態或二項式等)的數字序列的對象。

從Numpy版本1.17.0開始,可以使用許多不同的BitGenerators初始化Generator。 它包含了許多不同的概率分佈。 傳統的RandomState隨機數例程仍然可用,但僅限於單個BitGenerator。為了方便和向後兼容,單個RandomState實例的方法被導入到numpy.random命名空間。

默認情況下,Generator使用PCG64提供的位,該位具有比RandomState中的傳統mt19937隨機數生成器更好的統計屬性。

使用舊的numpy.random.RandomState

from numpy import random
random.standard_normal()

結果:1.3768264062478266

Generator可以替代RandomState。 現在,兩個類實例都擁有一個內部BitGenerator實例來提供位流,可以通過gen.bit_generator對其進行訪問。 某些過期的API清除意味着已從Generator中刪除了舊方法和兼容性方法。

# As replacement for RandomState(); default_rng() instantiates Generator with
# the default PCG64 BitGenerator.
from numpy.random import default_rng
rg = default_rng()
rg.standard_normal()
rg.bit_generator

<numpy.random._pcg64.PCG64 at 0x7f6f87dac270>

以下這種方式可以支持RandomState和Generator,但是它們的接口有很大的不同:

try:
  rg_integers = rg.integers
except AttributeError:
  rg_integers = rg.randint
a = rg_integers(1000)

結果:775

種子可以傳遞給任何BitGenerator。 提供的值通過SeedSequence進行混合,以將可能的種子序列分佈在BitGenerator的更廣泛的初始化狀態中。 這裡使用PCG64,並用Generator包裹。

from numpy.random import Generator, PCG64
rg = Generator(PCG64(12345))
rg.standard_normal()

結果:-1.4238250364546312

新的基礎結構採用了不同的方法來從RandomState對象生成隨機數。 隨機數生成分為兩個部分,即位生成器和隨機生成器。 BitGenerator的職責有限。 它管理狀態並提供產生隨機雙精度數和隨機無符號32位和64位值的功能。隨機生成器採用生成器提供的流並將其轉換成更有用的分佈,例如模擬的正常隨機值。 這種結構允許使用很少的代碼重複來使用替代位生成器。 Generator是面向用戶的對象,幾乎與RandomState相同。 初始化生成器的規範方法將PCG64位生成器作為唯一參數。

from numpy.random import default_rng
rg = default_rng(12345)
rg.random()

結果:0.22733602246716966

也可以直接使用BitGenerator實例實例化Generator。 要使用較舊的MT19937算法,可以直接實例化並將其傳遞給Generator

from numpy.random import Generator, MT19937
rg = Generator(MT19937(12345))
rg.random()

結果:0.37786929937474845

警告:生成器不再提供用於生成NumPy標準的Box-Muller方法。 使用Generator不能為正態分佈或任何其他依賴於正態的分佈(例如RandomState.gamma RandomState.standard_t)確切的隨機值。 如果需要按位向後兼容流,請使用RandomState。

  • Generator的常規,指數和伽馬函數使用256步Ziggurat方法,比NumPy的Box-Muller或逆CDF實現快2-10倍。
  • 可選的dtype參數,它接受np.float32或np.float64來為選擇分佈產生統一的單或雙精度的隨機變量
  • 可選的out參數,允許為選擇分佈填充現有陣列
  • random_entropy提供對密碼應用程序中使用的系統隨機性源的訪問(例如Unix上的/ dev / urandom)。
  • 所有BitGenerator都可以通過CType(ctype)和CFFI(cffi)生成double,uint64和uint32。這允許在numba中使用位生成器。
  • 位生成器可通過Cython用於下游項目。
  • 整數現在是從離散均勻分佈中生成整數隨機數的規範方法。 rand和randn方法僅可通過舊版RandomState使用。端點關鍵字可用於指定打開或關閉間隔。這將替換randint和已棄用的random_integers。
  • random現在是生成浮點隨機數的規範方法,它取代了RandomState.random_sample,RandomState.sample和RandomState.ranf。這與Python的隨機性是一致的。
  • 隨機。
  • numpy中的所有BitGenerator都使用SeedSequence將種子轉換為初始化狀態。

Generator可以訪問廣泛的發行版,並替代RandomState。 兩者之間的主要區別在於Generator依賴於附加的BitGenerator來管理狀態並生成隨機位,然後將這些隨機位從有用的分佈轉換為隨機值。 Generator使用的默認BitGenerator為PCG64。 可以通過將實例化的BitGenerator傳遞給Generator來更改BitGenerator。

也就是說,設置了:

np.random.default_rng(PCG64(隨機種子))

在生成隨機數的時候都會是相同的。然後替換掉了原來的RandomState(隨機種子)

如果省略seed或None,則每次都會實例化一個新的BitGenerator和Generator。 此功能不管理默認的全局實例。

Generator的一些方法:

Generator.integers(low, high=None, size=None, dtype=』int64』, endpoint=False)

例如:

rng = np.random.default_rng(PCG64(12345))
rng.integers(2, size=10)

結果:array([1, 0, 1, 0, 0, 1, 1, 1, 1, 0])

這裡的意思是生成10個數,這是個數的取值範圍在0-2之間,不包括2.

再看些例子:

rng.integers(5, size=(2, 4))

結果:array([[4, 3, 4, 0], [4, 0, 2, 1]])

rng.integers(1, [3, 5, 10])

結果:array([1, 3, 3])

這裡的意思是生成1×3的數組,並且每一位都限制了取值範圍。

rng.integers([1, 5, 7], 10)

結果:array([6, 6, 7])

rng.integers([1, 3, 5, 7], [[10], [20]], dtype=np.uint8)

結果:array([[ 1, 4, 8, 9], [ 5, 18, 16, 12]], dtype=uint8)

這裡使用了廣播機制。

Generator.random(size=None, dtype=』d』, out=None):

在半開區間[0.0,1.0)中返回隨機浮點數。
結果來自指定時間間隔內的「連續均勻」分佈。 要對𝑈𝑛𝑖𝑓[𝑎,𝑏)進行採樣,𝑏>𝑎。將random的輸出乘以(b-a)並加上a。

(b - a) * random() + a

看一些例子:

rng.random()

0.5110659735695771

type(rng.random())

float

rng.random((5,))

array([0.96743595, 0.68306482, 0.39162483, 0.18725257, 0.34596067])

我們可以稍加變化既可以改變獲得區間的值了,例如區間為[-5,0)

5 * rng.random((3, 2)) - 5

array([[-0.54395295, -1.12218029], [-3.409267 , -0.37891552], [-2.64545057, -1.53120579]])

Generator.choice()

choice(a, size=None, replace=True, p=None, axis=0):

Generates a random sample from a given 1-D array

看一些例子:

Generate a uniform random sample from np.arange(5) of size 3:

rng.choice(5, 3)

array([3, 0, 2])

Generate a non-uniform random sample from np.arange(5) of size 3:

rng.choice(5, 3, p=[0.1, 0, 0.3, 0.6, 0])

array([2, 3, 3])

Generate a uniform random sample from np.arange(5) of size 3 without replacement:

rng.choice(5, 3, replace=False)

array([0, 4, 1])

Generate a non-uniform random sample from np.arange(5) of size 3 without replacement:

rng.choice(5, 3, replace=False, p=[0.1, 0, 0.3, 0.6, 0])

array([3, 2, 0])

Any of the above can be repeated with an arbitrary array-like instead of just integers. For instance:

aa_milne_arr = ['pooh', 'rabbit', 'piglet', 'Christopher']
rng.choice(aa_milne_arr, 5, p=[0.5, 0.1, 0.1, 0.3])

array([‘piglet’, ‘Christopher’, ‘pooh’, ‘piglet’, ‘pooh’], dtype='<U11′

Generator.bytes(length)

  Return random bytes.

    Parameters

      length [int] Number of random bytes.

    Returns

      out [str] String of length length.

看一些例子:

rng.bytes(10)

b'[\x95\xe8\xc4\xbd\x16\xd8\x85\xa7*’

接下來是另外一些方法:

Generator.shuffle(x) 

看一些例子:

arr = np.arange(10)
arr
rng.shuffle(arr)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

array([9, 7, 8, 5, 0, 4, 3, 6, 1, 2])

arr = np.arange(9).reshape((3, 3))
arr
rng.shuffle(arr)
arr

array([[0, 1, 2], [3, 4, 5], [6, 7, 8]])

array([[6, 7, 8], [0, 1, 2], [3, 4, 5]])

Generator.permutation(x)

看一些例子:

rng.permutation(10)

array([1, 7, 4, 3, 0, 9, 2, 5, 8, 6])

rng.permutation([1, 4, 9, 12, 15])

array([15, 1, 9, 4, 12])

arr = np.arange(9).reshape((3, 3))
rng.permutation(arr)

array([[0, 1, 2], [6, 7, 8], [3, 4, 5]])

最後是一些統計分佈:

 就簡單的看一個分佈:

n, p = 10, .5 # number of trials, probability of each trial
s = rng.binomial(n, p, 1000)
# result of flipping a coin 10 times, tested 1000 times.

array([7, 8, 9, 4, 5, 6, 3, 5, 4, 7, 2, 7, 2, 7, 5, 4, 4, 7, 4, 6, 7, 4, 5, 5, 7, 4, 4, 6, 3, 4, 6, 6, 5, 7, 4, 7, 4, 7, 6, 6, 5, 6, 4, 6, 3, 6, 8, 8, 4, 7, 5, 5, 5, 5, 5, 8, 6, 3, 6, 5, 9, 4, 6, 5, 4, 3, 7, 2, 4, 5, 4, 5, 4, 6, 5, 6, 8, 3, 5, 3, 4, 5, 6, 4, 6, 6, 5, 7, 5, 8, 8, 5, 8, 6, 5, 5, 6, 8, 7, 8, 5, 1, 3, 5, 3, 5, 3, 4, 4, 7, 5, 3, 6, 7, 6, 1, 7, 4, 6, 6, 6, 3, 4, 3, 6, 3, 5, 6, 6, 5, 3, 7, 4, 5, 1, 4, 7, 6, 6, 5, 3, 4, 8, 3, 6, 4, 6, 3, 3, 5, 4, 6, 9, 3, 4, 4, 5, 4, 5, 4, 5, 7, 7, 4, 4, 5, 5, 2, 6, 6, 5, 3, 6, 3, 3, 5, 5, 8, 4, 4, 4, 7, 6, 1, 3, 8, 5, 5, 3, 4, 2, 7, 7, 5, 6, 3, 4, 5, 6, 5, 3, 7, 4, 6, 7, 3, 5, 5, 9, 6, 5, 6, 5, 3, 4, 6, 6, 5, 4, 3, 6, 4, 6, 7, 6, 5, 2, 6, 8, 4, 7, 5, 6, 6, 4, 5, 3, 3, 4, 6, 5, 7, 6, 7, 6, 5, 3, 5, 5, 3, 3, 8, 6, 4, 2, 4, 5, 8, 2, 6, 8, 8, 5, 6, 6, 2, 4, 7, 3, 3, 5, 7, 4, 5, 8, 7, 2, 6, 3, 8, 6, 7, 5, 3, 4, 3, 6, 7, 5, 7, 4, 5, 5, 5, 2, 3, 3, 6, 5, 9, 6, 4, 3, 6, 6, 3, 5, 8, 7, 3, 5, 7, 5, 2, 4, 4, 4, 8, 6, 9, 6, 8, 5, 7, 5, 6, 4, 7, 5, 7, 4, 5, 5, 7, 6, 4, 5, 7, 7, 6, 4, 7, 5, 6, 6, 6, 2, 4, 6, 6, 7, 6, 6, 7, 7, 4, 7, 8, 3, 5, 5, 5, 7, 1, 3, 6, 4, 5, 3, 8, 5, 3, 7, 5, 4, 3, 2, 7, 3, 4, 5, 3, 6, 6, 6, 4, 4, 6, 8, 5, 7, 3, 6, 4, 4, 2, 7, 3, 4, 4, 5, 6, 3, 3, 4, 7, 6, 7, 5, 1, 5, 4, 3, 4, 6, 5, 6, 6, 5, 5, 6, 6, 6, 4, 4, 6, 6, 6, 4, 2, 6, 3, 6, 2, 3, 3, 3, 6, 2, 4, 5, 5, 6, 5, 3, 3, 6, 4, 3, 4, 3, 6, 4, 5, 5, 5, 7, 5, 3, 6, 4, 4, 6, 4, 4, 5, 6, 6, 5, 1, 1, 3, 9, 5, 5, 6, 5, 3, 6, 4, 4, 2, 6, 6, 4, 2, 4, 3, 4, 6, 5, 5, 5, 5, 5, 5, 3, 7, 4, 7, 7, 5, 6, 5, 6, 8, 1, 7, 4, 4, 6, 4, 5, 3, 2, 5, 3, 7, 2, 3, 7, 4, 5, 2, 6, 5, 6, 6, 6, 5, 5, 6, 4, 6, 3, 7, 5, 3, 4, 4, 3, 5, 5, 5, 5, 4, 6, 5, 1, 6, 2, 5, 5, 7, 7, 4, 5, 3, 5, 4, 5, 5, 7, 5, 7, 5, 4, 8, 4, 2, 4, 6, 5, 6, 6, 7, 3, 7, 4, 5, 7, 4, 5, 4, 3, 5, 3, 2, 5, 4, 6, 5, 4, 4, 7, 6, 5, 3, 5, 3, 3, 5, 3, 3, 5, 6, 4, 7, 3, 5, 4, 6, 5, 5, 3, 4, 4, 6, 7, 7, 7, 6, 7, 6, 2, 3, 3, 6, 6, 3, 4, 3, 7, 6, 6, 5, 5, 5, 3, 5, 5, 6, 3, 7, 6, 6, 4, 5, 6, 4, 6, 5, 6, 5, 6, 8, 6, 1, 3, 5, 5, 5, 5, 5, 3, 6, 5, 7, 7, 8, 6, 3, 5, 5, 4, 2, 6, 6, 4, 1, 6, 6, 3, 4, 4, 6, 7, 6, 4, 4, 5, 6, 4, 4, 5, 6, 6, 5, 2, 4, 5, 4, 8, 4, 7, 4, 6, 6, 9, 6, 7, 7, 4, 5, 3, 4, 7, 4, 4, 4, 6, 3, 5, 3, 7, 3, 5, 8, 6, 5, 6, 5, 3, 6, 7, 4, 5, 7, 4, 4, 4, 3, 7, 6, 6, 6, 7, 5, 8, 1, 4, 4, 5, 6, 7, 8, 7, 5, 5, 5, 1, 5, 6, 3, 4, 3, 3, 4, 5, 3, 6, 6, 9, 6, 2, 3, 7, 3, 4, 5, 6, 5, 2, 4, 8, 4, 6, 4, 2, 4, 5, 7, 4, 7, 3, 4, 5, 8, 4, 4, 2, 4, 6, 6, 5, 7, 2, 6, 5, 5, 4, 3, 3, 3, 5, 8, 3, 7, 6, 4, 3, 4, 8, 5, 9, 4, 3, 5, 3, 5, 5, 8, 6, 1, 2, 1, 5, 5, 5, 7, 4, 5, 7, 6, 4, 3, 3, 8, 3, 2, 6, 5, 5, 6, 4, 4, 4, 3, 6, 5, 5, 5, 6, 6, 6, 4, 3, 5, 4, 5, 7, 3, 4, 4, 5, 5, 4, 7, 5, 3, 6, 6, 5, 6, 6, 4, 7, 6, 3, 4, 2, 6, 3, 5, 5, 3, 9, 7, 9, 4, 4, 3, 9, 6, 3, 1, 6, 4, 4, 6, 6, 5, 7, 5, 5, 5, 5, 4, 6, 6, 3, 5, 5, 5, 5, 6, 5, 5, 7, 3, 6, 3, 2, 7, 3, 3, 6, 4, 5, 5, 5, 6, 5, 6, 4, 3, 6, 8, 7, 3, 5, 6, 5, 6, 8, 6, 7, 4, 5, 7, 4, 5, 6, 4, 6, 6, 5, 4, 4, 5, 4, 6, 6, 3, 6, 6, 6, 6, 6, 3, 4, 6, 6, 4, 5, 3, 6, 6, 2, 6, 4, 4, 5, 7, 4, 6, 9, 6, 6, 6])

 

參考了numpy==1.17.4的英文文檔。