关于JAVA抓取网页信息 小弟今天遇到一个问题,关于用JAVA抓取网页信息,我想抓取指定的网页信息,比如说标题,正文,我想把目标地址HTML网页抓取到然后解析XML,但是XML的节点也太多了,不知道该怎样截取到我想要的信息,求各位大神帮帮忙,告诉我下该怎么截取到我想要的信息,小弟在此谢谢了,可以的话叫我Q356142739. 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 这个应该网络上有一大把现成的DEMO吧 建议获取到html之后,用dom4j去解析xml,可以参考http://www.ibm.com/developerworks/cn/xml/x-dom4j.html 解析html方法很多,我用的是Jsoup,值域找到你想要的内容,这个就比较麻烦了,要用些正文提取的手段,这种手段没有公认的有效成果,一般都是通过正文内容特征等等来搞 JAVA字符串比较很奇怪 ★★thread.sleep与系统时间相关?★★ 100分求助关于文件读取I/O流的操作 struts2 输入校验 急~100分求spring的框架图~ 如何才能获得所谓的工作经验 java登陆的问题 菜鸟小问,解决即给分,help 关于 Java applet 的问题(散分,在线等) 用springMVC框架我要从A的数据回调给B的远程接口 jboss下sqlserver jta全局数据源操作数据库出现一个问题,求解 hibernate “could not execute query” “Table 'user.tab_employee' doesn't exist”
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货