如一长串杂乱的字符串:asdgfa2a2g1223asdfaefzhongguoaaaloveadf
里面包含的 zhongguo 这个汉语全拼和  love 这个英文单词
C#里有什么办法实现程序在字符串检索出属于汉语全拼和英文单词的部分?要求把其它杂乱的字符串去掉
想了好久,没有好的解决办法,只好在此求大家帮忙了

解决方案 »

  1.   

    先定义一套拼音和英语单词的语法规则,然后生成一个词法/语法分析器去解析。可参考ANTLR(http://www.antlr.org)
      

  2.   


      string str = "asdgfa2a2g1223asdfaefzhongguoaaaloveadf ";
            if (str.IndexOf("zhongguo") > 0 && str.IndexOf("love") > 0)
            {
                str = str.Substring(str.IndexOf("zhongguo"),8) + str.Substring(str.IndexOf("love"),4);
                Response.Write(str);
            }
      

  3.   

    你必须有一个字典去比对才行,比如你搜索到一个“men”,你认为是拼音还是单词?