用java如何统计给出的一段文章中的所有中文词组的数量? 用java如何统计给出的一段文章中的所有中文词组的数量?谢谢! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 用lucene怎么样?这个是一个全文检索的,可以支持中文分词 StringTokenizer类可以分析处字符串并将字符串分解成可被独立使用的单词(识别英文单词没有问题就是不知道能不能识别中文单词)这个类有两个常用的构造方法:StringTokenizer(String s)为字符串构造一个分析器,使用默认的分隔符集合,-->即空格符、换行符、回车符、Tab符;StringTokenizer(String s,String delim)为字符串构造一个分析器,参数dilim中的字符作为分隔符、另外可以调用countTokens()方法得到计数变量的值。楼主可以参考这个类看看 该类包含在 java.util包中。(jdk 1.5) 分词算法可以分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。分词词典是中文自动分词系统的一个基本组成部分。中文分词的词典一般分为三类:1、基于整词二分的分词词典2、基于TRIE索引树的分词词典机制3、基于逐字二分的分词词典机制 to: ericqxg007(一笑而过)建议你看看正则式,看了之后你以后可能都不太会去用StringTokenizer了 分词不是个简单的问题,现在也不知道有什么好的基于JAVA的中文分词工具。 www.nlp.org.cn上有一个开源项目,是中文分词的,还有java的调用方法 求问一个简单的正则表达式 再发菜鸟贴,刚学,没办法啊 java抛出异常的详细信息如何保存到指定的文档里 一个好的地址!!不容错过啊! 请大家帮我改改啊. 怎样使JAVA APPLET在一台计算机中只运行一次? 怎么实现与远程的网页同步! 一道题 怎么给一个CSV文件中的数据插入行号 java新手提问 java application形式操作MySQL4.0.21数据库,如何能节约资源,提高效率? 请问,JBuilder下添加的组件为何总是变得很大?
StringTokenizer(String s)为字符串构造一个分析器,使用默认的分隔符集合,-->即空格符、换行符、回车符、Tab符;
StringTokenizer(String s,String delim)为字符串构造一个分析器,参数dilim中的字符作为分隔符、另外可以调用countTokens()方法得到计数变量的值。
楼主可以参考这个类看看
分词词典是中文自动分词系统的一个基本组成部分。
中文分词的词典一般分为三类:
1、基于整词二分的分词词典
2、基于TRIE索引树的分词词典机制
3、基于逐字二分的分词词典机制
建议你看看正则式,看了之后你以后可能都不太会去用StringTokenizer了