用lucene+heritrix做个局域网搜索引擎,那们大虾做过呢,给个思路,小弟在此先谢了
解决方案 »
- 关于java的基础知识的一道题
- JAVA 执行批处理 错误信息获取
- C语言标准的函数int GetPeopleName(char *strTmp, int *strLen),在java中怎么表示?
- My God! I need your help
- 过俩天就要去面试,请仁兄们给点试题和建议,谢谢?
- 关于nio的负载均衡 以及 3个db(一个sqlserver 两个mysql分别在不同IDC)这种奇怪
- 传参!!
- 把java类作为参数传到procedure中的问题
- 数组的问题。(php的函数用jsp实现)
- 新手请教老问题,关于日期的转换,还请各位不怕麻烦。谢谢。
- 高分求教用SAX解析1G-10G左右的XML的问题!
- swtich的参数为什么不允许是String形的。
然后提过一个web UI 让用户搜索这时用到lucene的search模块。webUI 和Heritrix是两个相对独立的程序。 共享一个文件系统。P.S. nutch是一个完整的搜索引擎,包括抓取网页,用lucene索引,搜索。 可以一试~~
1.生成索引文件
2.查询页面,输入查询词
3.查询页面,输出查询结果。官网:http://lucene.apache.org/