实在是不会写求人帮忙的 问过老师,他说用HashMap会简单些,这些都不怎么会,只能求高人了
题目要求:1 使用Swing作为开发界面;
2 针对一个文本文件或一个文件夹(遍历整理目录)进行统计;
3 对文本文件中英文进行分词;
分割符号:句号,分号,逗号,括号,引号
4 针对分词后结果进行单词频度统计,并将分析统计显示文本框中;
5 将单词分析统计结果保存到文件中。
6 针对单词在文本中出现频度进行排序。
题目要求:1 使用Swing作为开发界面;
2 针对一个文本文件或一个文件夹(遍历整理目录)进行统计;
3 对文本文件中英文进行分词;
分割符号:句号,分号,逗号,括号,引号
4 针对分词后结果进行单词频度统计,并将分析统计显示文本框中;
5 将单词分析统计结果保存到文件中。
6 针对单词在文本中出现频度进行排序。
Map<String,Count> res=new HashMap<String,Count>();
//此处循环,分割文字,略 String key=获取得每一个文字
{
if (res.contain(key){
res.get(key).count++;
}else{
res.put(key,new Count());
}
}
}
class Count{
int count=1;
}
还是只要符合分隔符号规则就算一个 可记录的条件?
比方: 你好,nihao,嘿
统计出来的结果:
你好 1次
nihao 1次
嘿 1次
是不是这样?是不是所有的文件类型都统计,还是只有.txt文件?
英文的好说,遍历一篇,用hashmap存储
中英文混合的,就必须实现分词了,如果按字统计就不必了