确实没有正经研究过算法,今天看到这个问题,想了很久没有想到怎么解决,最原始的方法谁都能够想到,但是这种原始方法显然效率非常低下,尤其是在字符串非常长的时候。因此,查阅网络,看到这两篇文章:
1、求一个字符串中连续出现次数最多的子串 (imcdragon的专栏 )
读过之后,才发现,原来这字符串可以这样处理。
但是,代码在程序上是有点问题的,就是加入存在相同数量的连续子字符串,不能够都输出。于是,想到把结果存入map中,代码如下:
/*
基本算法描述:
给出一个字符串abababa
1.穷举出所有的后缀子串
substrs[0] = abababa;
substrs[1] = bababa;
substrs[2] = ababa;
substrs[3] = baba;
substrs[4] = aba;
substrs[5] = ba;
substrs[6] = a;
2.然后进行比较
substrs[0]比substrs[1]多了一个字母,如果说存在连续匹配的字符,那么
substrs[0]的第1个字母要跟substrs[1]首字母匹配,同理
substrs[0]的前2个字母要跟substrs[2]的前2个字母匹配(否则不能叫连续匹配)
substrs[0]的前n个字母要跟substrs[n]的前n个字母匹配.
如果匹配的并记下匹配次数.如此可以求得最长连续匹配子串.
*/
#include<iostream>
#include<string>
#include<vector>
#include<map>
usingnamespace std;
map<string,int> fun(conststring&str)
{
vector<string> substrs;
int maxcount =1, count =1;
string substr;
int i, len = str.length();
map<string,int> map_SubCount;// 把str字符串中的子串按每次把头部减少一个的方式插入到vector向量中
// 即,获取原字符串的后缀数组,并保持原来的顺序不变
for(i=0; i<len;++i)
{
substrs.push_back(str.substr(i, len-i));
}// 打印出后缀数组,substrs[]
cout<<"#############################################"<<endl;
for(i=0; i<len;++i)
{
cout << substrs[i]<< endl;
}
cout<<"#############################################"<<endl;
// 从后缀数组的第一个元素,开始遍历,依次进行比较
for(i=0; i<len;++i)
{
// 后缀数组中substrs[i]之后的元素依次与substrs[i]比较
for(int j=i+1; j<len;++j)
{
count =1;
// 如果前j-i个元素相同
// 如果有连续一个子串出现就继续遍历vector的下一个子串中的和现在出现相同子串的地方的下一个或几个字符
if(substrs[i].substr(0, j-i)== substrs[j].substr(0,j-i))
{
++count;
// 子串中前j-i个元素相同
for(int k=j+(j-i); k<len; k+=j-i)
{
if(substrs[i].substr(0,j-i)== substrs[k].substr(0, j-i))
++count;
else
break;
}
// 记录所有遍历中的最大连续子串出现的次数
if(count >= maxcount)
{
maxcount = count;
substr = substrs[i].substr(0, j-i);
map_SubCount.insert(make_pair(substr, maxcount));
}
}
}
}
return map_SubCount;
}int _tmain(int argc, _TCHAR* argv[])
{
map<string,int> rs;string str="abababababaccccc";
rs = fun(str);map<string,int>::iterator iter = rs.begin();
for(;iter != rs.end(); iter++)
{
cout << iter->first <<':'<< iter->second <<'\n';
}system("pause");
return0;
}