难道就没人碰到过这种问题?大家在UTF-8编码下,是如何抓取页面的?

解决方案 »

  1.   

    honsire(恨水不成冰)
    如果你能解决,多少分都成.
    我想这也是使用UTF-8编码的页面,生成html一个迫切解决的问题吧
    bluesu27(bluesu27) 
    不行!
      

  2.   

    struts中文问题:
    如果是request的话,加入filter,就ok了,具体的例子都见过,我就不write了.
    如果是数据库读取,那就写两个static method 在前台调用,具体的例子我就不写了,太多了.
    如果是applicationresources.properties的问题,就用native2ascii -encoding .....处理.具体的google下,我也不写了.
    但是最重要的事,字符一定要统一.
    如果数据库里面本身就乱码,oracle和sybase我知道如何去解决,别的我就菜了
      

  3.   

    当把<%@ page contentType="text/html; charset=UTF-8"%>和<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">全换成GBK时,抓出来的页面完全正常,显然问题是出在请求的编码上了,不知道这该如何改?
      

  4.   

    有没有这个?
    request.setCharacterEncoding("UTF-8");有没有做encoding filter类?
      

  5.   

    java.io.InputStream l_urlStream = l_connection.getInputStream(); 
    java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream, "UTF-8")); 
      

  6.   

    先写一个字符的转换方法,就是转换成GB2312字符的方法,然后凡是遇到有中文要显示到页面时,就先用这个方法来做一次转换,然后再输出到页面中去。
    request.setCharacterEncoding("UTF-8");这种方法我用过,不过有时候它起不到作用,仍然会出现乱码的。
      

  7.   

    楼上的,用encoding filter即实现这个功能,且只写一次。这个是tomcat支持的。
      

  8.   

    utf-8下面爪取gb2312的页面中的内容没有问题的,我就这么做过,不知搂主可不可以再详细讲解一下问题
      

  9.   

    在TOMCAT 5.0及以上,<%@ page contentType="text/html; charset=UTF-8"%>是不用写的。
      

  10.   

    zuohaosh() 
    感觉就是你这个方法了,等我回去后试试!
      

  11.   

    zuohaosh(湖南伢子)
    非常感谢.照你说的已经基本实现.只要存文件时以UTF-8格式存就OK了.