富有挑战性的中文乱码问题,解决者200分！！！

难道就没人碰到过这种问题?大家在UTF-8编码下,是如何抓取页面的?

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

honsire(恨水不成冰)
如果你能解决,多少分都成.
我想这也是使用UTF-8编码的页面,生成html一个迫切解决的问题吧
bluesu27(bluesu27)
不行!
struts中文问题:
如果是request的话,加入filter,就ok了,具体的例子都见过,我就不write了.
如果是数据库读取,那就写两个static method 在前台调用,具体的例子我就不写了,太多了.
如果是applicationresources.properties的问题,就用native2ascii -encoding .....处理.具体的google下,我也不写了.
但是最重要的事,字符一定要统一.
如果数据库里面本身就乱码,oracle和sybase我知道如何去解决,别的我就菜了
当把<%@ page contentType="text/html; charset=UTF-8"%>和<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">全换成GBK时,抓出来的页面完全正常,显然问题是出在请求的编码上了,不知道这该如何改?
有没有这个？
request.setCharacterEncoding("UTF-8");有没有做encoding filter类？
java.io.InputStream l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream, "UTF-8"));
先写一个字符的转换方法，就是转换成GB2312字符的方法，然后凡是遇到有中文要显示到页面时，就先用这个方法来做一次转换，然后再输出到页面中去。
request.setCharacterEncoding("UTF-8");这种方法我用过，不过有时候它起不到作用，仍然会出现乱码的。
楼上的，用encoding filter即实现这个功能，且只写一次。这个是tomcat支持的。
utf-8下面爪取gb2312的页面中的内容没有问题的，我就这么做过，不知搂主可不可以再详细讲解一下问题
在TOMCAT 5.0及以上，<%@ page contentType="text/html; charset=UTF-8"%>是不用写的。
zuohaosh()
感觉就是你这个方法了,等我回去后试试!
zuohaosh(湖南伢子)
非常感谢.照你说的已经基本实现.只要存文件时以UTF-8格式存就OK了.