用httpclient包,去模拟浏览器登录,将返回的html做处理,找出你自己要的数据就行了。

解决方案 »

  1.   

    jsoup
      

  2.   

    用jsoup试试看,就是一个工具!
      

  3.   

    有没有比较好的帖子让我学习下啊。jsoup或者其他技术
      

  4.   

    我在使用这个jar包,但是抓取环球新闻的图片链接,返回对象是 空。是防盗链么,我要怎么获取呢
    附代码
    String webUrl="http://world.huanqiu.com/";
    Document webDoc;
    try {
    webDoc = (Document)Jsoup.connect(webUrl).get();
    Elements msgs=webDoc.select("li[name=item]");
    for(Element  msg:msgs)
    {
    System.out.println("国际新闻");
    System.out.println(msg.select("dd").html());//若有图片会输出img标签
    //System.out.println(msg.select("img").first().attr("src"));//有图片也获取不到
    }
    } catch (IOException e) {
    e.printStackTrace();
    }