到网上去down中科院的一个Java浏览器吧,那个是有源代码的,解析HTML做得还不错。iscas.intec

解决方案 »

  1.   

    没用过,不过自己写过html分析器。
      

  2.   

    是什么样的东西大家研究一下吧!不过不能通过发送HTTP请求然后读取返回的信息来分析吗?
      

  3.   

    祝各位新年快乐,
    大家可以把自己的想法随便说说,
    如果关注的人多了,我也加多点分进来。先谢谢 crm2000(浏览器) 兄,我要慢慢看看代码先。 wyjs(春日) 兄,你好,我的意图,可能还不是很明白,我现在是希望分析html文件,然后可以随意更改html的标签和属性,如果就是单纯的用 String.indexOf() 处理起来就很麻烦了。请各位朋友多点发言。谢谢!
      

  4.   

    HTMLDocument.Iterator有两个方法isValid()和next(),如果isValid的结果为false,表示没有包含tag,HTMLDocument.Iterator的源码是这样实现的:
    当生成HTMLDocument.Iterator时,会自动查询第一个tag,但如果根本没有存在tag时,它的isValid的返回为false,如果存在tag,那么为true,getStartOffset()返回-1只有一种情况,就是不存在该tag。如:htmldocument.getIterator(HTML.IMG);
    如果你的html中不存在html.img tag,那么你的返回就是-1,在每次的next之前先判断是否存在tag(isValid方法)
      

  5.   

    好,谢谢您 , occultme(神秘),很详细,
    我想再问一下,怎么为一个单节点的元素加属性,
    我怎么加也加不了。
    就是为<input type="text" name="test"> 加一个value="good"的属性,
    怎么加呢?
    occultme(神秘)帮忙解决完这个问题,就结贴。