為什麼你用不好Numpy的random函式?

dicksonjyl560101發表於2018-01-08

為什麼你用不好Numpyrandom函式?

 

https://mp.weixin.qq.com/s?__biz=MzI2NjY5NzI0NA==&mid=2247483733&idx=1&sn=1ac9e23f63499710a520667843fbc5ea&chksm=ea8b6e26ddfce7307088de78c9e53f2b0562321299ac54725b5897a8d73cce0757d97fc58d15&scene=21

 

python資料分析的學習和應用過程中,經常需要用到numpy的隨機函式,由於隨機函式random的功能比較多,經常會混淆或記不住,下面我們一起來彙總學習下。

1.         import numpy as np

1 numpy.random.rand()

numpy.random.rand(d0,d1,...,dn)

  • rand函式根據給定維度生成[0,1)之間的資料,包含0,不包含1
  • dn表格每個維度
  • 返回值為指定維度的array

1.         np.random.rand(4,2)

1.         array([[ 0.02173903,  0.44376568],

2.                [ 0.25309942,  0.85259262],

3.                [ 0.56465709,  0.95135013],

4.                [ 0.14145746,  0.55389458]])

1.         np.random.rand(4,3,2) # shape: 4*3*2

1.         array([[[ 0.08256277,  0.11408276],

2.                 [ 0.11182496,  0.51452019],

3.                 [ 0.09731856,  0.18279204]],

4.          

5.                [[ 0.74637005,  0.76065562],

6.                 [ 0.32060311,  0.69410458],

7.                 [ 0.28890543,  0.68532579]],

8.          

9.                [[ 0.72110169,  0.52517524],

10.              [ 0.32876607,  0.66632414],

11.              [ 0.45762399,  0.49176764]],

12.       

13.             [[ 0.73886671,  0.81877121],

14.              [ 0.03984658,  0.99454548],

15.              [ 0.18205926,  0.99637823]]])

2 numpy.random.randn()

numpy.random.randn(d0,d1,...,dn)

  • randn函式返回一個或一組樣本,具有標準正態分佈。
  • dn表格每個維度
  • 返回值為指定維度的array

1.         np.random.randn() # 當沒有引數時,返回單個資料

1.         -1.1241580894939212

1.         np.random.randn(2,4)

1.         array([[ 0.27795239, -2.57882503,  0.3817649 ,  1.42367345],

2.                [-1.16724625, -0.22408299,  0.63006614, -0.41714538]])

1.         np.random.randn(4,3,2)

1.         array([[[ 1.27820764,  0.92479163],

2.                 [-0.15151257,  1.3428253 ],

3.                 [-1.30948998,  0.15493686]],

4.          

5.                [[-1.49645411, -0.27724089],

6.                 [ 0.71590275,  0.81377671],

7.                 [-0.71833341,  1.61637676]],

8.          

9.                [[ 0.52486563, -1.7345101 ],

10.              [ 1.24456943, -0.10902915],

11.              [ 1.27292735, -0.00926068]],

12.       

13.             [[ 0.88303   ,  0.46116413],

14.              [ 0.13305507,  2.44968809],

15.              [-0.73132153, -0.88586716]]])

標準正態分佈介紹

  • 標準正態分佈---standard normal distribution
  • 標準正態分佈又稱為u分佈,是以0為均值、以1為標準差的正態分佈,記為N01)。

3 numpy.random.randint()

3.1 numpy.random.randint()

numpy.random.randint(low, high=None, size=None, dtype='l')

  • 返回隨機整數,範圍區間為[low,high),包含low,不包含high
  • 引數:low為最小值,high為最大值,size為陣列維度大小,dtype為資料型別,預設的資料型別是np.int
  • high沒有填寫時,預設生成隨機數的範圍是[0low)

1.         np.random.randint(1,size=5) # 返回[0,1)之間的整數,所以只有0

1.         array([0, 0, 0, 0, 0])

1.         np.random.randint(1,5) # 返回1[1,5)時間的隨機整數

1.         4

1.         np.random.randint(-5,5,size=(2,2))

1.         array([[ 2, -1],

2.                [ 2,  0]])

3.2 numpy.random.random_integers

numpy.random.random_integers(low, high=None, size=None)

  • 返回隨機整數,範圍區間為[low,high],包含lowhigh
  • 引數:low為最小值,high為最大值,size為陣列維度大小
  • high沒有填寫時,預設生成隨機數的範圍是[1low]

該函式在最新的numpy版本中已被替代,建議使用randint函式

1.         np.random.random_integers(1,size=5)

1.         array([1, 1, 1, 1, 1])

4 生成[0,1)之間的浮點數

  • numpy.random.random_sample(size=None)
  • numpy.random.random(size=None)
  • numpy.random.ranf(size=None)
  • numpy.random.sample(size=None)

1.         print('-----------random_sample--------------')

2.         print(np.random.random_sample(size=(2,2)))

3.         print('-----------random--------------')

4.         print(np.random.random(size=(2,2)))

5.         print('-----------ranf--------------')

6.         print(np.random.ranf(size=(2,2)))

7.         print('-----------sample--------------')

8.         print(np.random.sample(size=(2,2)))

1.         -----------random_sample--------------

2.         [[ 0.34966859  0.85655008]

3.          [ 0.16045328  0.87908218]]

4.         -----------random--------------

5.         [[ 0.25303772  0.45417512]

6.          [ 0.76053763  0.12454433]]

7.         -----------ranf--------------

8.         [[ 0.0379055   0.51288667]

9.          [ 0.71819639  0.97292903]]

10.      -----------sample--------------

11.      [[ 0.59942807  0.80211491]

12.       [ 0.36233939  0.12607092]]

5 numpy.random.choice()

numpy.random.choice(a, size=None, replace=True, p=None)

  • 從給定的一維陣列中生成隨機數
  • 引數: a為一維陣列類似資料或整數;size為陣列維度;p為陣列中的資料出現的機率
  • a為整數時,對應的一維陣列為np.arange(a)

1.         np.random.choice(5,3)

1.         array([4, 1, 4])

1.         np.random.choice(5, 3, replace=False)

2.         # replaceFalse時,生成的隨機數不能有重複的數值

1.         array([0, 3, 1])

1.         np.random.choice(5,size=(3,2))

1.         array([[1, 0],

2.                [4, 2],

3.                [3, 3]])

1.         demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']

2.         np.random.choice(demo_list,size=(3,3))

1.         array([['moto', 'iphone', 'xiaomi'],

2.                ['lenovo', 'xiaomi', 'xiaomi'],

3.                ['xiaomi', 'lenovo', 'iphone']],

4.               dtype='<U7')

  • 引數p的長度與引數a的長度需要一致;
  • 引數p為機率,p裡的資料之和應為1

1.         demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']

2.         np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])

1.         array([['sansumg', 'sansumg', 'sansumg'],

2.                ['sansumg', 'sansumg', 'sansumg'],

3.                ['sansumg', 'xiaomi', 'iphone']],

4.               dtype='<U7')

6 numpy.random.seed()

  • np.random.seed()的作用:使得隨機資料可預測。
  • 當我們設定相同的seed,每次生成的隨機數相同。如果不設定seed,則每次會生成不同的隨機數

1.         np.random.seed(0)

2.         np.random.rand(5)

1.         array([ 0.5488135 ,  0.71518937,  0.60276338,  0.54488318,  0.4236548 ])

1.         np.random.seed(1676)

2.         np.random.rand(5)

1.         array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])

1.         np.random.seed(1676)

2.         np.random.rand(5)

1.         array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])    

 

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2149845/,如需轉載,請註明出處,否則將追究法律責任。

相關文章