我访问的页面用的是UTF-8,打印出来的没问题。再试试GBK的,等等。

解决方案 »

  1.   

    这个代码你看一下:public class C1 {  static String gbktst = "http://community.csdn.net/Expert/search.asp?bigclassid=54&smallclassid=5409";  public static void test2(){
        try {
          Parser parser = new Parser(gbktst);
          NodeList list = parser.parse (new TagNameFilter("form"));
          System.out.println(list.size());
          Node node = list.elementAt(0);
          FormTag form = (FormTag) node;
          System.out.println(form.getChildrenHTML());
        } catch (Exception e) {
          e.printStackTrace();
        }
      }
    }出于代码格式方面的考试,里边的空格用的是两个全角来代替“TAB”格的。
    你在试的时候改回来,可能有点烦 :)