解决方案 »

  1.   

    就是在我做的网站上有一个单独的模块,显示信息,内容的从网站上抓取关于IT方面的消息,类似百度的爬虫功能,根据别人输入的条件,可以爬取到相关的内容,我要做的是固定搜索的条件,只抓取出IT方面的消息,根据时间吧,大概就是这个意思
      

  2.   

    我也觉得,感觉楼主只是通过"调用"百度的搜索功能,进行信息的采集
    那敢问,怎么调用,我现在是用jsoup获取到了一张网页上的我要抓取的内容
      

  3.   

    我觉得用javascript比较好,具体怎么做也不知道
      

  4.   

    感谢几位给我出谋划策,我现在已经完成了基本功能,使用的是Jsoup。谢了
      

  5.   

    百度应该提供搜索开发接口,应该js的接口,这样开发应该比较合适,自己做搜索引擎是个浩大的工程,项目成本不允许,当然也可以看看google有没有,但是这种借口功能提供应该比较简单。
    如果不能满足的话,java还是有一些开源的搜索引擎项目,但是据我所知对中文语汇分析支持得都不好。搜索引擎一般包含 爬虫,语汇分析,数据分析,数据索引等内容,如果有兴趣可以研究,但不推荐小项目使用。
      

  6.   

    jsoup,httpclient,xpath都可以,都用过,感觉xpath比较好用,通过google浏览器xpath插件可以选区任意页面内容。
      

  7.   

    我也觉得,感觉楼主只是通过"调用"百度的搜索功能,进行信息的采集
    那敢问,怎么调用,我现在是用jsoup获取到了一张网页上的我要抓取的内容能给一些代码吗 我现在就想做一个这样的东西出来   就是"调用"百度的搜索功能,进行信息的采集