怎样能统计几个字符串中,长度不定的出现频率高的子字符串?请高手指点

解决方案 »

  1.   

    请把问题描述清楚点?
    怎样能统计几个字符串:s1,s2,s3 中,长度不定的出现频率高的子字符串(sub1,sub2是s1的子字符串?sub3,sub1是s2的子字符串), 这样看起来sub1的频率比较高.如果是这样,简单的方法是分割出所有子字符串,进一步统计这些子字符串中存在相同子字符串的频率次数, 如果用STL, 做一个结构保存这些信息:typedef struct SUBSTRING
    {
       vector<string> vec; 存放子字符串   int nCount;这个子字符串的出现频率计数
    };