让我们先来看一段代码,熟悉一下seed()的使用:
import numpy as np
num = 0
while (num < 5):
np.random.seed(1)
print(np.random.random())
num += 1
print('-------------------------')
num1 = 0
np.random.seed(2)
while (num1 < 5):
print(np.random.random())
num1 += 1
其运行结果是:
0.417022004702574
0.417022004702574
0.417022004702574
0.417022004702574
0.417022004702574
-------------------------
0.43599490214200376
0.025926231827891333
0.5496624778787091
0.4353223926182769
0.42036780208748903
通过上面的两个例子的对比我们可以发现:第一个例子中打印的随机数的一样的,但是第二个例子中打印的是不同的随机数,这是为什么呢?
其实啊,所谓的随机数其实是伪随机数,所谓的‘伪’,意思是这些数其实是有规律的,只不过因为算法规律太复杂,很难看出来。但是在复杂的算法都要一个初始值,如果没有一个初始值,他也不能凭空制造一系列的随机数出来,那我们说的随机种子seed()就是这是初始值。
让我们看看random随机数是怎么生成的:我们将这套复杂的算法(是叫随机数生成器吧)看成一个黑盒,把我们准备好的种子扔进去,它会返给你两个东西,一个是你想要的随机数,另一个是保证能生成下一个随机数的新的种子,把新的种子放进黑盒,又得到一个新的随机数和一个新的种子,从此在生成随机数的路上越走越远。
现在来看看代码:
第一段代码把对种子的设置放在了循环里面,每次执行循环都旗帜鲜明地告诉黑盒:“我的种子是1”。那么很显然:同一个黑盒,同一个种子,自然得到的是同一个随机数。
第二段代码把对种子的设置放在了循环外面,他只在第一次循环的时候明确地告诉黑盒:“我的种子是2”。那么也很显然:从第二次循环开始,黑盒用的就是自己生成的新种子了。
另外再说一下:所有标准库提供的Random函数其实都是假Random,提供的随机数也是伪随机数,真正的Random函数式不需要Seed的。所谓假Random,是指所返回的随机数字其实是一个稳定算法所得出的稳定结果序列,而不是真正意义上的随机序列。 Seed就是这个算法开始计算的第一个值。所以就会出现只要seed是一样的,那么后续所有“随机”结果和顺序也都是完全一致的。 通常情况下,你可以用 DateTime.Now.Millisecend() 也就是当前始终的毫秒来做Seed .因为毫秒对你来说是一个1000以内的随即数字。 这样可以大大改善保准库的Random结果的随机性。 不过这仍然算不上是完全随机,因为重复的概率还是千分之一。
总之如果种子没有变,产生的随机数就不会变的。