关于网站爬虫问题?高手请指教 我现在要做一个网站,网站有很多模块,每个模块是从一个网站里面爬下来的,而且每天都要更新,要爬接近20个网站,我现在用的方式是先获取网页源码,然后再用正则匹配过滤掉我不需要的内容,但我觉得这样很烦,请高手指点下,谢谢了.. 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 爬虫HERITRIX我也在学习这个爬虫怎么用,配置完了总是会出现点问题,等待高手出现指点一下 难道还有更好的办法?用正则应该是比较简单的方法了,除非有这样的类库使用期待得到更好的办法JAVA资料太多?选中想收藏的文字(图片),右键选“收录到易载”,搞定! jsp后台报错 大家帮帮忙啊! 大侠帮帮忙:Java位运算符~ 请教个 Eclipse环境问题!谢谢! 用eclipse可以打开jar文件查看代码吗? 菜菜的问:怎么打开一个shell窗口? JTable 的拖拉时的滚动条问题?急!急!急! 跪拜求解,散分 老板突然要用java做项目,我一点都不懂,不知道用那本书好点?老板要求不能用microsoft的java. 这句话实什么意思? 怎么样讲vector的数据通过copyInto输出到二维数组 求一正则表达式,是关于数字验证的!
我也在学习这个爬虫怎么用,配置完了总是会出现点问题,等待高手出现指点一下
用正则应该是比较简单的方法了,除非有这样的类库使用
期待得到更好的办法
JAVA资料太多?选中想收藏的文字(图片),右键选“收录到易载”,搞定!