在考虑lucene做站内搜索
现在能查到的有两种主要的方式 一种是用蜘蛛进行网站抓取 然后分析,但是动态网页对蜘蛛抓取效果不是特别的好。
另外一种是直接对数据库进行索引建立 然后进行搜索。
现在我不明白 在web搜索中 通过lucene建立的索引能找到对应的页面么?
总感觉第二种方式实现的站内搜索是一种孤立的,不能搜索到具体页面的搜索方式。
但是如果是这样的话这种搜索又失去了其具体的意义。
我这些想法哪里不对请大家指出,谢谢!
现在能查到的有两种主要的方式 一种是用蜘蛛进行网站抓取 然后分析,但是动态网页对蜘蛛抓取效果不是特别的好。
另外一种是直接对数据库进行索引建立 然后进行搜索。
现在我不明白 在web搜索中 通过lucene建立的索引能找到对应的页面么?
总感觉第二种方式实现的站内搜索是一种孤立的,不能搜索到具体页面的搜索方式。
但是如果是这样的话这种搜索又失去了其具体的意义。
我这些想法哪里不对请大家指出,谢谢!
如文章的ID你总要保存在索引中吧,搜索时你就可以得到符合条件的文章ID,然后再根据这个ID显示这篇文章