Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。

random.random

random.random()用于生成一个0到1的随机符点数: 0 <= n < 1.0

random.uniform

  random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限。如果a > b,则生成的随机数n: a <= n <= b。如果 a <b, 则 b <= n <= a。

 

  1. print random.uniform(10, 20)  
  2. print random.uniform(20, 10)  
  3. #---- 结果(不同机器上的结果不一样)  
  4. #18.7356606526  
  5. #12.5798298022  
print random.uniform(10, 20) print random.uniform(20, 10) #---- 结果(不同机器上的结果不一样) #18.7356606526 #12.5798298022

random.randint

  random.randint()的函数原型为:random.randint(a, b),用于生成一个指定范围内的整数。其中参数a是下限,参数b是上限,生成的随机数n: a <= n <= b

 

  1. print random.randint(12, 20)  #生成的随机数n: 12 <= n <= 20  
  2. print random.randint(20, 20)  #结果永远是20  
  3. #print random.randint(20, 10)  #该语句是错误的。下限必须小于上限。  
print random.randint(12, 20) #生成的随机数n: 12 <= n <= 20 print random.randint(20, 20) #结果永远是20 #print random.randint(20, 10) #该语句是错误的。下限必须小于上限。

random.randrange

  random.randrange的函数原型为:random.randrange([start], stop[, step]),从指定范围内,按指定基数递增的集合中 获取一个随机数。如:random.randrange(10, 100, 2),结果相当于从[10, 12, 14, 16, ... 96, 98]序列中获取一个随机数。random.randrange(10, 100, 2)在结果上与 random.choice(range(10, 100, 2) 等效。

random.choice

  random.choice从序列中获取一个随机元素。其函数原型为:random.choice(sequence)。参数sequence表示一个有序类型。这里要说明 一下:sequence在python不是一种特定的类型,而是泛指一系列的类型。list, tuple, 字符串都属于sequence。有关sequence可以查看python手册数据模型这一章。下面是使用choice的一些例子:

 

  1. print random.choice("学习Python")   
  2. print random.choice(["JGood", "is", "a", "handsome", "boy"])  
  3. print random.choice(("Tuple", "List", "Dict"))  
print random.choice("学习Python") print random.choice(["JGood", "is", "a", "handsome", "boy"]) print random.choice(("Tuple", "List", "Dict"))

random.shuffle

  random.shuffle的函数原型为:random.shuffle(x[, random]),用于将一个列表中的元素打乱。如:

  1. p = ["Python", "is", "powerful", "simple", "and so on..."]  
  2. random.shuffle(p)  
  3. print p  
  4. #---- 结果(不同机器上的结果可能不一样。)  
  5. #['powerful', 'simple', 'is', 'Python', 'and so on...']  
p = ["Python", "is", "powerful", "simple", "and so on..."] random.shuffle(p) print p #---- 结果(不同机器上的结果可能不一样。) #['powerful', 'simple', 'is', 'Python', 'and so on...']

random.sample

  random.sample的函数原型为:random.sample(sequence, k),从指定序列中随机获取指定长度的片断。sample函数不会修改原有序列。

 

  1. list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]  
  2. slice = random.sample(list, 5)  #从list中随机获取5个元素,作为一个片断返回  
  3. print slice  
  4. print list #原有序列并没有改变。  

 

 

随机整数:
>>> import random
>>> random.randint(0,99)
21

随机选取0到100间的偶数:
>>> import random
>>> random.randrange(0, 101, 2)
42

随机浮点数:
>>> import random
>>> random.random() 
0.85415370477785668
>>> random.uniform(1, 10)
5.4221167969800881

随机字符:
>>> import random
>>> random.choice('abcdefg&#%^*f')
'd'

多个字符中选取特定数量的字符:
>>> import random
random.sample('abcdefghij',3) 
['a', 'd', 'b']

多个字符中选取特定数量的字符组成新字符串:
>>> import random
>>> import string
>>> string.join(random.sample(['a','b','c','d','e','f','g','h','i','j'], 3)).r
eplace(" ","")
'fih'

随机选取字符串:
>>> import random
>>> random.choice ( ['apple', 'pear', 'peach', 'orange', 'lemon'] )
'lemon'

洗牌:
>>> import random
>>> items = [1, 2, 3, 4, 5, 6]
>>> random.shuffle(items)
>>> items
[3, 2, 5, 6, 4, 1]

---------------------------------------------------------------------------

numpy.random

在python数据分析的学习和应用过程中,经常需要用到numpy的随机函数,由于随机函数random的功能比较多,经常会混淆或记不住,下面我们一起来汇总学习下。

import numpy as np
1 numpy.random.rand()

numpy.random.rand(d0,d1,…,dn)

  • rand函数根据给定维度生成[0,1)之间的数据,包含0,不包含1
  • dn表格每个维度
  • 返回值为指定维度的array
np.random.rand(4,2)
  1.  
    array([[ 0.02173903, 0.44376568],
  2.  
    [ 0.25309942, 0.85259262],
  3.  
    [ 0.56465709, 0.95135013],
  4.  
    [ 0.14145746, 0.55389458]])
np.random.rand(4,3,2) # shape: 4*3*2
  1.  
    array([[[ 0.08256277, 0.11408276],
  2.  
    [ 0.11182496, 0.51452019],
  3.  
    [ 0.09731856, 0.18279204]],
  4.  
     
  5.  
    [[ 0.74637005, 0.76065562],
  6.  
    [ 0.32060311, 0.69410458],
  7.  
    [ 0.28890543, 0.68532579]],
  8.  
     
  9.  
    [[ 0.72110169, 0.52517524],
  10.  
    [ 0.32876607, 0.66632414],
  11.  
    [ 0.45762399, 0.49176764]],
  12.  
     
  13.  
    [[ 0.73886671, 0.81877121],
  14.  
    [ 0.03984658, 0.99454548],
  15.  
    [ 0.18205926, 0.99637823]]])
2 numpy.random.randn()

numpy.random.randn(d0,d1,…,dn)

  • randn函数返回一个或一组样本,具有标准正态分布。
  • dn表格每个维度
  • 返回值为指定维度的array
np.random.randn() # 当没有参数时,返回单个数据
-1.1241580894939212
np.random.randn(2,4)
  1.  
    array([[ 0.27795239, -2.57882503, 0.3817649 , 1.42367345],
  2.  
    [-1.16724625, -0.22408299, 0.63006614, -0.41714538]])
np.random.randn(4,3,2)
  1.  
    array([[[ 1.27820764, 0.92479163],
  2.  
    [-0.15151257, 1.3428253 ],
  3.  
    [-1.30948998, 0.15493686]],
  4.  
     
  5.  
    [[-1.49645411, -0.27724089],
  6.  
    [ 0.71590275, 0.81377671],
  7.  
    [-0.71833341, 1.61637676]],
  8.  
     
  9.  
    [[ 0.52486563, -1.7345101 ],
  10.  
    [ 1.24456943, -0.10902915],
  11.  
    [ 1.27292735, -0.00926068]],
  12.  
     
  13.  
    [[ 0.88303 , 0.46116413],
  14.  
    [ 0.13305507, 2.44968809],
  15.  
    [-0.73132153, -0.88586716]]])

标准正态分布介绍

  • 标准正态分布—-standard normal distribution
  • 标准正态分布又称为u分布,是以0为均值、以1为标准差的正态分布,记为N(0,1)。
3 numpy.random.randint()

3.1 numpy.random.randint()

numpy.random.randint(low, high=None, size=None, dtype=’l’)

  • 返回随机整数,范围区间为[low,high),包含low,不包含high
  • 参数:low为最小值,high为最大值,size为数组维度大小,dtype为数据类型,默认的数据类型是np.int
  • high没有填写时,默认生成随机数的范围是[0,low)
np.random.randint(1,size=5) # 返回[0,1)之间的整数,所以只有0
array([0, 0, 0, 0, 0])
np.random.randint(1,5) # 返回1个[1,5)时间的随机整数
4
np.random.randint(-5,5,size=(2,2))
  1.  
    array([[ 2, -1],
  2.  
    [ 2, 0]])

3.2 numpy.random.random_integers

numpy.random.random_integers(low, high=None, size=None)

  • 返回随机整数,范围区间为[low,high],包含low和high
  • 参数:low为最小值,high为最大值,size为数组维度大小
  • high没有填写时,默认生成随机数的范围是[1,low]

该函数在最新的numpy版本中已被替代,建议使用randint函数

np.random.random_integers(1,size=5)
array([1, 1, 1, 1, 1])
4 生成[0,1)之间的浮点数
  • numpy.random.random_sample(size=None)
  • numpy.random.random(size=None)
  • numpy.random.ranf(size=None)
  • numpy.random.sample(size=None)
  1.  
    print('-----------random_sample--------------')
  2.  
    print(np.random.random_sample(size=(2,2)))
  3.  
    print('-----------random--------------')
  4.  
    print(np.random.random(size=(2,2)))
  5.  
    print('-----------ranf--------------')
  6.  
    print(np.random.ranf(size=(2,2)))
  7.  
    print('-----------sample--------------')
  8.  
    print(np.random.sample(size=(2,2)))
  1.  
    -----------random_sample--------------
  2.  
    [[ 0.34966859 0.85655008]
  3.  
    [ 0.16045328 0.87908218]]
  4.  
    -----------random--------------
  5.  
    [[ 0.25303772 0.45417512]
  6.  
    [ 0.76053763 0.12454433]]
  7.  
    -----------ranf--------------
  8.  
    [[ 0.0379055 0.51288667]
  9.  
    [ 0.71819639 0.97292903]]
  10.  
    -----------sample--------------
  11.  
    [[ 0.59942807 0.80211491]
  12.  
    [ 0.36233939 0.12607092]]
5 numpy.random.choice()

numpy.random.choice(a, size=None, replace=True, p=None)

  • 从给定的一维数组中生成随机数
  • 参数: a为一维数组类似数据或整数;size为数组维度;p为数组中的数据出现的概率
  • a为整数时,对应的一维数组为np.arange(a)
np.random.choice(5,3)
array([4, 1, 4])
  1.  
    np.random.choice(5, 3, replace=False)
  2.  
    # 当replace为False时,生成的随机数不能有重复的数值
array([0, 3, 1])
np.random.choice(5,size=(3,2))
  1.  
    array([[1, 0],
  2.  
    [4, 2],
  3.  
    [3, 3]])
  1.  
    demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
  2.  
    np.random.choice(demo_list,size=(3,3))
  1.  
    array([['moto', 'iphone', 'xiaomi'],
  2.  
    ['lenovo', 'xiaomi', 'xiaomi'],
  3.  
    ['xiaomi', 'lenovo', 'iphone']],
  4.  
    dtype='<U7')
  • 参数p的长度与参数a的长度需要一致;
  • 参数p为概率,p里的数据之和应为1
  1.  
    demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
  2.  
    np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
  1.  
    array([['sansumg', 'sansumg', 'sansumg'],
  2.  
    ['sansumg', 'sansumg', 'sansumg'],
  3.  
    ['sansumg', 'xiaomi', 'iphone']],
  4.  
    dtype='<U7')
6 numpy.random.seed()
  • np.random.seed()的作用:使得随机数据可预测。
  • 当我们设置相同的seed,每次生成的随机数相同。如果不设置seed,则每次会生成不同的随机数
  1.  
    np.random.seed(0)
  2.  
    np.random.rand(5)
array([ 0.5488135 ,  0.71518937,  0.60276338,  0.54488318,  0.4236548 ])
  1.  
    np.random.seed(1676)
  2.  
    np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])
  1.  
    np.random.seed(1676)
  2.  
    np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])    

random.random

random.random()用于生成一个0到1的随机符点数: 0 <= n < 1.0

random.uniform

  random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限。如果a > b,则生成的随机数n: a <= n <= b。如果 a <b, 则 b <= n <= a。

 

  1. print random.uniform(10, 20)  
  2. print random.uniform(20, 10)  
  3. #---- 结果(不同机器上的结果不一样)  
  4. #18.7356606526  
  5. #12.5798298022  
print random.uniform(10, 20) print random.uniform(20, 10) #---- 结果(不同机器上的结果不一样) #18.7356606526 #12.5798298022

random.randint

  random.randint()的函数原型为:random.randint(a, b),用于生成一个指定范围内的整数。其中参数a是下限,参数b是上限,生成的随机数n: a <= n <= b

 

  1. print random.randint(12, 20)  #生成的随机数n: 12 <= n <= 20  
  2. print random.randint(20, 20)  #结果永远是20  
  3. #print random.randint(20, 10)  #该语句是错误的。下限必须小于上限。  
print random.randint(12, 20) #生成的随机数n: 12 <= n <= 20 print random.randint(20, 20) #结果永远是20 #print random.randint(20, 10) #该语句是错误的。下限必须小于上限。

random.randrange

  random.randrange的函数原型为:random.randrange([start], stop[, step]),从指定范围内,按指定基数递增的集合中 获取一个随机数。如:random.randrange(10, 100, 2),结果相当于从[10, 12, 14, 16, ... 96, 98]序列中获取一个随机数。random.randrange(10, 100, 2)在结果上与 random.choice(range(10, 100, 2) 等效。

random.choice

  random.choice从序列中获取一个随机元素。其函数原型为:random.choice(sequence)。参数sequence表示一个有序类型。这里要说明 一下:sequence在python不是一种特定的类型,而是泛指一系列的类型。list, tuple, 字符串都属于sequence。有关sequence可以查看python手册数据模型这一章。下面是使用choice的一些例子:

 

  1. print random.choice("学习Python")   
  2. print random.choice(["JGood", "is", "a", "handsome", "boy"])  
  3. print random.choice(("Tuple", "List", "Dict"))  
print random.choice("学习Python") print random.choice(["JGood", "is", "a", "handsome", "boy"]) print random.choice(("Tuple", "List", "Dict"))

random.shuffle

  random.shuffle的函数原型为:random.shuffle(x[, random]),用于将一个列表中的元素打乱。如:

  1. p = ["Python", "is", "powerful", "simple", "and so on..."]  
  2. random.shuffle(p)  
  3. print p  
  4. #---- 结果(不同机器上的结果可能不一样。)  
  5. #['powerful', 'simple', 'is', 'Python', 'and so on...']  
p = ["Python", "is", "powerful", "simple", "and so on..."] random.shuffle(p) print p #---- 结果(不同机器上的结果可能不一样。) #['powerful', 'simple', 'is', 'Python', 'and so on...']

random.sample

  random.sample的函数原型为:random.sample(sequence, k),从指定序列中随机获取指定长度的片断。sample函数不会修改原有序列。

 

  1. list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]  
  2. slice = random.sample(list, 5)  #从list中随机获取5个元素,作为一个片断返回  
  3. print slice  
  4. print list #原有序列并没有改变。  

 

 

随机整数:
>>> import random
>>> random.randint(0,99)
21

随机选取0到100间的偶数:
>>> import random
>>> random.randrange(0, 101, 2)
42

随机浮点数:
>>> import random
>>> random.random() 
0.85415370477785668
>>> random.uniform(1, 10)
5.4221167969800881

随机字符:
>>> import random
>>> random.choice('abcdefg&#%^*f')
'd'

多个字符中选取特定数量的字符:
>>> import random
random.sample('abcdefghij',3) 
['a', 'd', 'b']

多个字符中选取特定数量的字符组成新字符串:
>>> import random
>>> import string
>>> string.join(random.sample(['a','b','c','d','e','f','g','h','i','j'], 3)).r
eplace(" ","")
'fih'

随机选取字符串:
>>> import random
>>> random.choice ( ['apple', 'pear', 'peach', 'orange', 'lemon'] )
'lemon'

洗牌:
>>> import random
>>> items = [1, 2, 3, 4, 5, 6]
>>> random.shuffle(items)
>>> items
[3, 2, 5, 6, 4, 1]

---------------------------------------------------------------------------

numpy.random

在python数据分析的学习和应用过程中,经常需要用到numpy的随机函数,由于随机函数random的功能比较多,经常会混淆或记不住,下面我们一起来汇总学习下。

import numpy as np
1 numpy.random.rand()

numpy.random.rand(d0,d1,…,dn)

  • rand函数根据给定维度生成[0,1)之间的数据,包含0,不包含1
  • dn表格每个维度
  • 返回值为指定维度的array
np.random.rand(4,2)
  1.  
    array([[ 0.02173903, 0.44376568],
  2.  
    [ 0.25309942, 0.85259262],
  3.  
    [ 0.56465709, 0.95135013],
  4.  
    [ 0.14145746, 0.55389458]])
np.random.rand(4,3,2) # shape: 4*3*2
  1.  
    array([[[ 0.08256277, 0.11408276],
  2.  
    [ 0.11182496, 0.51452019],
  3.  
    [ 0.09731856, 0.18279204]],
  4.  
     
  5.  
    [[ 0.74637005, 0.76065562],
  6.  
    [ 0.32060311, 0.69410458],
  7.  
    [ 0.28890543, 0.68532579]],
  8.  
     
  9.  
    [[ 0.72110169, 0.52517524],
  10.  
    [ 0.32876607, 0.66632414],
  11.  
    [ 0.45762399, 0.49176764]],
  12.  
     
  13.  
    [[ 0.73886671, 0.81877121],
  14.  
    [ 0.03984658, 0.99454548],
  15.  
    [ 0.18205926, 0.99637823]]])
2 numpy.random.randn()

numpy.random.randn(d0,d1,…,dn)

  • randn函数返回一个或一组样本,具有标准正态分布。
  • dn表格每个维度
  • 返回值为指定维度的array
np.random.randn() # 当没有参数时,返回单个数据
-1.1241580894939212
np.random.randn(2,4)
  1.  
    array([[ 0.27795239, -2.57882503, 0.3817649 , 1.42367345],
  2.  
    [-1.16724625, -0.22408299, 0.63006614, -0.41714538]])
np.random.randn(4,3,2)
  1.  
    array([[[ 1.27820764, 0.92479163],
  2.  
    [-0.15151257, 1.3428253 ],
  3.  
    [-1.30948998, 0.15493686]],
  4.  
     
  5.  
    [[-1.49645411, -0.27724089],
  6.  
    [ 0.71590275, 0.81377671],
  7.  
    [-0.71833341, 1.61637676]],
  8.  
     
  9.  
    [[ 0.52486563, -1.7345101 ],
  10.  
    [ 1.24456943, -0.10902915],
  11.  
    [ 1.27292735, -0.00926068]],
  12.  
     
  13.  
    [[ 0.88303 , 0.46116413],
  14.  
    [ 0.13305507, 2.44968809],
  15.  
    [-0.73132153, -0.88586716]]])

标准正态分布介绍

  • 标准正态分布—-standard normal distribution
  • 标准正态分布又称为u分布,是以0为均值、以1为标准差的正态分布,记为N(0,1)。
3 numpy.random.randint()

3.1 numpy.random.randint()

numpy.random.randint(low, high=None, size=None, dtype=’l’)

  • 返回随机整数,范围区间为[low,high),包含low,不包含high
  • 参数:low为最小值,high为最大值,size为数组维度大小,dtype为数据类型,默认的数据类型是np.int
  • high没有填写时,默认生成随机数的范围是[0,low)
np.random.randint(1,size=5) # 返回[0,1)之间的整数,所以只有0
array([0, 0, 0, 0, 0])
np.random.randint(1,5) # 返回1个[1,5)时间的随机整数
4
np.random.randint(-5,5,size=(2,2))
  1.  
    array([[ 2, -1],
  2.  
    [ 2, 0]])

3.2 numpy.random.random_integers

numpy.random.random_integers(low, high=None, size=None)

  • 返回随机整数,范围区间为[low,high],包含low和high
  • 参数:low为最小值,high为最大值,size为数组维度大小
  • high没有填写时,默认生成随机数的范围是[1,low]

该函数在最新的numpy版本中已被替代,建议使用randint函数

np.random.random_integers(1,size=5)
array([1, 1, 1, 1, 1])
4 生成[0,1)之间的浮点数
  • numpy.random.random_sample(size=None)
  • numpy.random.random(size=None)
  • numpy.random.ranf(size=None)
  • numpy.random.sample(size=None)
  1.  
    print('-----------random_sample--------------')
  2.  
    print(np.random.random_sample(size=(2,2)))
  3.  
    print('-----------random--------------')
  4.  
    print(np.random.random(size=(2,2)))
  5.  
    print('-----------ranf--------------')
  6.  
    print(np.random.ranf(size=(2,2)))
  7.  
    print('-----------sample--------------')
  8.  
    print(np.random.sample(size=(2,2)))
  1.  
    -----------random_sample--------------
  2.  
    [[ 0.34966859 0.85655008]
  3.  
    [ 0.16045328 0.87908218]]
  4.  
    -----------random--------------
  5.  
    [[ 0.25303772 0.45417512]
  6.  
    [ 0.76053763 0.12454433]]
  7.  
    -----------ranf--------------
  8.  
    [[ 0.0379055 0.51288667]
  9.  
    [ 0.71819639 0.97292903]]
  10.  
    -----------sample--------------
  11.  
    [[ 0.59942807 0.80211491]
  12.  
    [ 0.36233939 0.12607092]]
5 numpy.random.choice()

numpy.random.choice(a, size=None, replace=True, p=None)

  • 从给定的一维数组中生成随机数
  • 参数: a为一维数组类似数据或整数;size为数组维度;p为数组中的数据出现的概率
  • a为整数时,对应的一维数组为np.arange(a)
np.random.choice(5,3)
array([4, 1, 4])
  1.  
    np.random.choice(5, 3, replace=False)
  2.  
    # 当replace为False时,生成的随机数不能有重复的数值
array([0, 3, 1])
np.random.choice(5,size=(3,2))
  1.  
    array([[1, 0],
  2.  
    [4, 2],
  3.  
    [3, 3]])
  1.  
    demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
  2.  
    np.random.choice(demo_list,size=(3,3))
  1.  
    array([['moto', 'iphone', 'xiaomi'],
  2.  
    ['lenovo', 'xiaomi', 'xiaomi'],
  3.  
    ['xiaomi', 'lenovo', 'iphone']],
  4.  
    dtype='<U7')
  • 参数p的长度与参数a的长度需要一致;
  • 参数p为概率,p里的数据之和应为1
  1.  
    demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
  2.  
    np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
  1.  
    array([['sansumg', 'sansumg', 'sansumg'],
  2.  
    ['sansumg', 'sansumg', 'sansumg'],
  3.  
    ['sansumg', 'xiaomi', 'iphone']],
  4.  
    dtype='<U7')
6 numpy.random.seed()
  • np.random.seed()的作用:使得随机数据可预测。
  • 当我们设置相同的seed,每次生成的随机数相同。如果不设置seed,则每次会生成不同的随机数
  1.  
    np.random.seed(0)
  2.  
    np.random.rand(5)
array([ 0.5488135 ,  0.71518937,  0.60276338,  0.54488318,  0.4236548 ])
  1.  
    np.random.seed(1676)
  2.  
    np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])
  1.  
    np.random.seed(1676)
  2.  
    np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])