通过网页的url获取网页的标题,如果网页没有指定标题,则获取到"未命名"

解决方案 »

  1.   

    好像在request里面有一个getHeart的方法是获取标题的吧
      

  2.   

    使用htmlParser.jar
    String line;
    URL myUrl=new URL("http://www.google.cn#myinfo");
    StringBuffer sb = new StringBuffer();
    DataInputStream dis=new DataInputStream(myUrl.openStream());
    while((line=dis.readLine())!=null)
     sb.append(line);Parser = Parser.createParser(sb.toString(), "GBK"); 
    HtmlPage htmlvisitor = new HtmlPage(myParser); 
    String title = htmlvisitor.getTitle();
      

  3.   

    还有一个问题就是,如果html页面不规范的话,这个的识别率怎么样!
      

  4.   

    首先我不知道htmlParser.jar的效率如何,但是我想如果想获得Title,而title肯定是在<title></title>标签之内,如果是个符合语法的HTML,那么就没有什么问题,用正则表达式也可以处理,或者就用String的subString这样的方法来处理。
      

  5.   

    谢谢,我比较喜欢这个方法,只是用的parser不一样.做了一些修改,对各种常见编码有效.谢谢你.
      

  6.   

    为什么我无法得到title,解析 后结果为<title>°?????????????????      </title>