小记:dp好像分好多种,看到了斜率dp,概率dp,树形dp,。。。今天遇到了一个概率dp题,不晓得怎么入手。然后百度之,原来是概率dp,瞬间觉得好高端,看也看不懂,于是想着看能找点入门题做下。从网上找了一道,就是此题了。。。
题目大意:有一个程序,有n种bug和m个子系统,当找到一个bug时,它只会在一个系统。当然也可能你在其它系统也可以找到这样的bug,但是那是在找到另一个bug的时候,虽然两个是一种。规定一天只会找到一个bug。问,找到n种bug,且分布在m个子系统中的期望天数。
题解:因为每天都有一个,所以bug是无穷多个的。因此,每天找到一个bug它是某种类型的概率是1/n,在某个系统找到的概率是1/m。
令dp[i][j] 表示为找到了i种bug,分布在j个子系统中时,要到到目标状态所需要的期望天数。
很显然dp[n][m] = 0,而dp[0][0]就是我们要求的目标状态。
当我们找到了一个bug时,有四种情况可能出现;
dp[i][j],这个bug是原来i种就有的,且也在原来的j个子系统中
dp[i+1][j] ,这个bug是原来i种里所没有的,但在原来的j个子系统中
dp[i][j+1],这个bug在原来的i种就有的,但不在原来的j个子系统中
dp[i+1][j+1],这个bug是原来i种里所没有的,但也不在原来的j个子系统中
每一种发生的概率为:
p1 = i*j/(n*m)
p2 = (n-i)*j/(n*m)
p3 = i*(m-j)/(n*m)
p4 = (n-i)*(m-j)/(n*m)
根据期望的性质(在里面相加等于在各个分别期望相加),可得
dp[i,j] = p1*dp[i,j] + p2*dp[i+1,j] + p3*dp[i,j+1] + p4*dp[i+1,j+1] + 1
= ( n*s + (n-i)*j*dp[i+1,j] + i*(s-j)*dp[i,j+1] + (n-i)*(s-j)*dp[i+1,j+1] )/( n*s - i*j )
代码:
#include <iostream>
#include <cstdio>
#include <string>
#include <map>
#include <cstring>
using namespace std;
const int MAX_ = 1010;
double dp[MAX_][MAX_];
int main() {
int n,m;
while(~scanf("%d%d",&n,&m)) {
dp[n][m] = 0.0;
for(int i = n; i >= 0; i--){
for(int j = m; j >= 0; j--){
if(i == n && j== m)continue;
dp[i][j] = (n*m + (n-i)*j*dp[i+1][j] +
i * (m-j) *dp[i][j+1] +
(n-i) * (m- j) *dp[i+1][j+1])/(n*m -i*j);
}
}
printf("%.4lf\n",dp[0][0]);
}
return 0;
}