jsoup 要求返回 的 格式特殊。
你具体什么网页?

解决方案 »

  1.   

    现在又好了,就封我一两个小时
    public class zhengzeTest { public static void main(String[] args) {
    String url = "http://hz.ganji.com/fang1/1237836895x.htm";
    String fileterregEx = ".*ganji.com/fang.*htm.*";
    Pattern   p   =   Pattern.compile(fileterregEx);      
            Matcher   m   =   p.matcher(url);
            if (m.find()) {
    System.out.println("yes");
    }else {
    System.out.println("no");
    }
            Document doc = Utils.connect(url);
            gettext(url, doc);
    }
    private static void gettext(String url, Document doc) {

    String getsummaryRule = "div#js-summary > div";
    Element e = doc.select(getsummaryRule).first();
    // System.out.println(doc);
    System.out.println(doc.baseUri());
    String s = "\n"+url+"\n"+e.text();
    System.out.println(s);
    }
    }
      

  2.   

    这很简单,使用类似  eclipse 插件  TCP/IP Monitor 这样的软件观察 http 通信的内容,如果内容完全相同就不会得到不同的结果。你应该能看出2个通信有什么不同的内容,比如它们的 http header 中哪些值不一样,你需要模拟出一样的。