我试图让数据符合概率分布(在我的例子中是伽马函数)。在
用瞬间法我取得了一些成功:mean, var = data.mean(), data.var()
α, β = mean ** 2 / var, var / mean
x = np.linspace(0, 100)
plt.plot(x, gamma.pdf(x, α, 0, β))
# Pandas is in use
data.plot(kind='hist', xlim=(0, 100), bins=500, normed=True, color='lightblue')
data.dropna().plot(kind='kde', xlim=(0, 100), style='r--')
但是这并不令人满意,所以我决定使用scipy的方法fit:
^{pr2}$
但我所取得的唯一结果是这种分布:
有人能描述一下我做错了什么吗?
我认为gamma.fit至少应该和矩量法一样好。在
升级版:
gamma.fit返回:(0.00077655597754514266, -6.0499462017751218e-25, 3.6337557495676194)
data.describe()表示数据正常:count 5546.000000
mean 45.601515
std 28.563211
min 0.000000
25% 35.000000
50% 42.000000
75% 52.000000
max 1488.000000
dtype: float64
正在尝试使用data[[data > 0]]强制将位置设置为0来筛选数据args = gamma.fit(list(data[[data > 0]]), floc=0)
args
(7.897834117836718, 0, 5.7749678991293987)
提供更好的结果。好像现在起作用了。谢谢!在