题三 统计单词个数(30分)
问题描述
给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保证每行一定为20个)。要求将此字母串分成k份(1<k<=40),且每份中包含的单词个数加起来总数最大(每份中包含的单词可以部分重叠。当选用一个单词之后,其第一个字母不能再用。例如字符串this中可包含this和is,选用this之后就不能包含th)。
单词在给出的一个不超过6个单词的字典中。
要求输出最大的个数。
输入格式
去部输入数据放在文本文件input3.dat中,其格式如下:
第一行为一个正整数(0<n<=5)表示有n组测试数据
每组的第一行有二个正整数(p,k)
p表示字串的行数;
k表示分为k个部分。
接下来的p行,每行均有20个字符。
再接下来有一个正整数s,表示字典中单词个数。(1<=s<=6)
接下来的s行,每行均有一个单词。
输出格式
结果输出至屏幕,每行一个整数,分别对应每组测试数据的相应结果。
样例
输入:
1
1 3
thisisabookyouareaoh
4
is
a
ok
sab
输出: //说明:(不必输出)
7 // this/isabookyoua/reaoh
【思路】
DP+字符串。
最优划分。设d[i][j]表示把前i个数划分为j段的最大单词数。则有转移方程:
d[i][j]=max(d[i][j],d[k][j-1]+sum[k+1][i]);
其中sum(s,t)表示st段内的单词数,离线计算。
【代码】
1 #include<iostream> 2 #include<cstring> 3 using namespace std; 4 5 const int maxn = 200+10; 6 7 string expr=""; 8 string words[maxn]; 9 int wordslen[maxn],sum[maxn][maxn]; 10 int d[maxn][maxn]; 11 int p,K,m; 12 13 int add(int l,int r) 14 { 15 int ans=0; 16 if (r-1>=0) ans=sum[l][r-1]; 17 bool vis[maxn]={0}; 18 for (int i=1;i<=m;i++) 19 { 20 int qd=r-wordslen[i]+1; 21 if (qd<l) continue; 22 if (qd==expr.find(words[i],qd)) 23 { 24 if (vis[qd]) continue; 25 vis[qd]=1; 26 ans++; 27 for (int j=1;j<=m;j++) 28 { 29 int dq=r-wordslen[j]; 30 if (dq==qd) 31 if (dq==expr.find(words[j],dq)) 32 { 33 ans--; 34 break; 35 } 36 } 37 } 38 } 39 return ans; 40 } 41 42 int main() { 43 ios::sync_with_stdio(false); 44 cin>>p>>K; 45 for(int i=0;i<p;i++) { 46 string s; cin>>s; 47 expr=expr+s; 48 } 49 cin>>m; 50 for(int i=1;i<=m;i++) { 51 cin>>words[i]; 52 wordslen[i]=words[i].size(); 53 } 54 55 int len=expr.size(); 56 for(int i=0;i<len;i++) 57 for(int j=i;j<len;j++){ 58 sum[i][j]=add(i,j); 59 } 60 61 for(int i=0;i<len-1;i++) 62 for(int j=1;j<=min(K-1,i+1);j++) 63 for(int k=j-2;k<i;k++) 64 if(j==1) d[i][j]=sum[0][j]; 65 else d[i][j]=max(d[i][j],d[k][j-1]+sum[k+1][i]); 66 int ans=0; 67 for(int i=K-1;i<len-1;i++) 68 ans=max(ans,d[i][K-1]+sum[i+1][len-1]); 69 cout<<ans; 70 return 0; 71 }