heritrix-1.14.3中创建一个jobs用来抓取一个固定网站的页面,当该jobs完成后,就停止了。但该网站的页面每天都会更新(增加)几个页面的,当jobs完成后,就无法运行了,怎么设置能抓取更新的页面?请大家帮忙解决一下,谢谢~~!

解决方案 »

  1.   

    请问楼主,怎样配置Job才可以抓取一个网站的内容呀?我试了好多次,都不能生效.
      

  2.   

    邱哲, 符滔滔. 开发自己的搜索引擎-Lucene2.0+Heritrix. 人民邮电出版社
    你参考这本书吧
      

  3.   

    我敢负责任的告诉楼主,楼上说的那本书里面没有您想要的答案。那本书讲的heritrix任然是教新手怎样使用,对楼主没有帮组,其实我也遇到了这个问题,如果楼主解决了这个问题,可否教我,如果没有解决,可以加我的qq:542107840,我们一起交流