关于网站爬虫问题?高手请指教 我现在要做一个网站,网站有很多模块,每个模块是从一个网站里面爬下来的,而且每天都要更新,要爬接近20个网站,我现在用的方式是先获取网页源码,然后再用正则匹配过滤掉我不需要的内容,但我觉得这样很烦,请高手指点下,谢谢了.. 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 爬虫HERITRIX我也在学习这个爬虫怎么用,配置完了总是会出现点问题,等待高手出现指点一下 难道还有更好的办法?用正则应该是比较简单的方法了,除非有这样的类库使用期待得到更好的办法JAVA资料太多?选中想收藏的文字(图片),右键选“收录到易载”,搞定! java怎样解析json数据哦? android手机如何直接访问SD卡 各位看<think in java>第二版英文版,有什么心得吗?我英文不好,借助词吧,看的速度超慢,好像一千多夜,不知道啥时候才能看完 exception问题 buttonGroup 如何 用java 来过滤在1.6亿的纪录里是否有40万的特殊纪录。 代码错误 请高手指点 我的网页ie打不开,可是ftp和ping命令都可以通过,看看是什么问题? 电脑转让,java的全套软件(北京) jdbc的中文问题! 怎么样讲vector的数据通过copyInto输出到二维数组 求一正则表达式,是关于数字验证的!
我也在学习这个爬虫怎么用,配置完了总是会出现点问题,等待高手出现指点一下
用正则应该是比较简单的方法了,除非有这样的类库使用
期待得到更好的办法
JAVA资料太多?选中想收藏的文字(图片),右键选“收录到易载”,搞定!