我有1万多个关键字
然后 现在有很多文章 ,现在 给 我一篇文章 ,要 判断出 我1万个关键 哪些有,出现多少次各位看看 有什么好思路。谢谢我想了下,除了indexof或者正则表达式 还没想到 其他 比较 好的 算法
然后 现在有很多文章 ,现在 给 我一篇文章 ,要 判断出 我1万个关键 哪些有,出现多少次各位看看 有什么好思路。谢谢我想了下,除了indexof或者正则表达式 还没想到 其他 比较 好的 算法
解决方案 »
- 如何在java应用程序中播放音频文件?
- 求救 递归算法结果是什么
- ibatis的配置
- 请问:import java.awt.* 与import java.awt.event.*有什么区别?
- JFrame里有没有一种Panel独立于所有组件之上类似于GlassPane
- JTABLE的表头怎么可以有2行或者多行,就是我的表头有2行构成,其中有几列是合并的,怎么实现,谢谢
- 请教JAVA应用程序如何在JDK1.4下不能运行噢!
- 【简单问题求助】知道局域网上一台机器的ip地址了,怎么进入他的系统?
- 我写的播放声音的代码,但是可以读到文件 不能播放,请高手帮忙调试
- 简单的数组问题
- 求助P2P五子棋的测试
- java 文件传输
关键字用哈希表保存.
对一万个关键字进行整理,建立两个信息表.
表1保存关键字的长度(一个长度值只保存一次)
表2保存关键字的过滤信息(比如保存每个关键字的前两个字,重复值只保存一次)2,算法
以给定文档的文字为单位进行循环.每次循环做以下处理:
A该次循环的文字位置开始取两个字,到过滤信息表中检索.如果存在该过滤信息记录,则继续处理B,否则开始下一个文字的循环.
B取得检索到的过滤信息所关联的长度信息,做循环处理,每次循环从现在文字位置处取文字长度的文字串,对关键字表进行检索.如检索到则记录次数.
大概意思就是这样,楼主可做参考.
我也是才了解
http://www.cppblog.com/hunter/archive/2008/11/16/67039.aspx