我用的是htmlparser来实现的,请问用htmlparser是怎么实现的?

解决方案 »

  1.   

    可以用里面的page类,不知道行不行,我不知道怎么用的,望指教!!
      

  2.   

    我做过类似的,但不是用htmlparser做的,htmlparser好像不错,但是不会用我自己一行一行的分析的,然后替换
      

  3.   

    htmlparser看过他的介绍,他好象是每个html标签都对应一个类的,可能有一个img类可以得到src里的字符串。不知道有没有记错,具体实现还是靠自己的。搜索一下很多htmlparser的解释!
      

  4.   

    这样应该可以,具体字符串内容你自己读入
    Lexer lexer = new Lexer("a dcd<img src=ddddd />");
    //System.out.print(lexer.toString());
    while (null != (node = lexer.nextNode()))
    if (node instanceof TagNode)
    {
    TagNode tag = (TagNode) node;
    if (tag.getTagName().equals("IMG") && !tag.isEndTag())
    {
    String imgSrc = tag.getAttribute("src");
    if (null != imgSrc)
    {
    System.out.println(tag.getText());
    tag.setAttribute("src","http://hoos");

    System.out.println(tag.getText());


    }
    }
    }
    }
    catch(Exception e)
    {
    e.printStackTrace();
    }
      

  5.   

    to:opencsdn(虚心求教)
    你说的那个方法不行哦,还是没有替换掉那些地址的。
      

  6.   

    Parser parser = new Parser();
            try {
                parser.setURL(url);
                parser.setEncoding("gb2312");
                Node[] images = parser.extractAllNodesThatAre(ImageTag.class);
                if (images.length != 0) {
                    for (int i = 0; i < images.length; i++) {
                        ImageTag imageTag = (ImageTag) images[i];
                           imageTag.setAttribute("src",newpath);
                            System.out.println(newpath);
                    }
                } else {
                    String error = "文件中不存在图象的地址!!";
                    this.wrongURL.add(error);
                    //logger.info(error);
                }