自从以前学习JSP开始,中文乱码问题就一直不断,苦不堪言。这次在项目开始之前,我们要解决的第一个问题就是把mysql的中文乱码问题搞定。经过多天的努力,终于成功的解决了中文乱码问题,特写在这里,以备后用。软件及环境:Windows XP(2000), j2sdk1.4.2, Tomcat 5.0.25, mysql 4.1, EMS Mysql Manager 2(方便建表,版本2.8.5.1),驱动为mysql-connector-java-3.1.4-beta-bin.jar。目标:在该环境下,实现中文的正常显示,读取与插入数据库。注:我只在此环境下测试通过,别的系统及不同版本未测试要点:统一字符集(JSP页面编码,mysql建库时字符集选择,连接数据库URL,request设定等)下面我以GBK为例讲解。如果要使用utf-8,只要在相应的GBK处换成utf-8即可--------------------------- 步骤1 以GBK字符集建库建表 -------------------------------------我使用EMS来建mysql的数据库及表,因为它是图形界面,方便操作(就像SQL SERVER 2000中的企业管理器一样)。建库时,从EMS菜单中选create Database...新建一个数据库,CharacterSet选gbk_bin(另一个gbk_chinese_ci不知道与这个有什么区别,我找资料也没有找到。如果你知道,请告诉我,我补充在这里)。不要把工具栏上有一个加号和数据库模样的图标当成新建数据库了,那个新注册一个已经存在的数据库。 后面建表时,也要选择同样的字符集。建好后,此时不要用EMS向里面插入数据,否则你看到的中文依然是乱码。--------------------------- 步骤2 连接数据库的URL后加些参数 -------------------------------假设我新建的数据库是testdb,那么我连接数据库的url应该为:jdbc:mysql://localhost:3306/testdb?useUnicode=true&characterEncoding=gbk此时要注意:如果我是把这个url写在JAVA代码中,就直接这样写。但如果是在xml配置文件中(如struts-config.xml,web.xml等),要把其中的&改为&才行,否则会出错。也就是:jdbc:mysql://localhost:3306/testdb?useUnicode=true&characterEncoding=gbk--------------------------- 步骤3 每个JSP页面都要声明该中文字符集 ----------------------------在每个JSP页面的最上面都加上一句<%@ page language=java contentType=text/html;charset=GBK %>这样才能保证JSP页面中的中文显示正常--------------------------- 步骤4 加一个传递参数时设定request字符集的filter类 -----------------------因为网络中字符在传递的时候,都是统一以iso-8859-1的编码传递,所以我们必须对request重新设定字符集,才能正常显示中文。如果采用filter类来实现,我们不用在每次取中文参数时都要重新设定。filter类的内容:/* * ==================================================================== * * JavaWebStudio 开源项目 * * Struts_db v0.1 * * ==================================================================== */ package com.strutsLogin.util;import java.io.IOException;import javax.servlet.Filter; import javax.servlet.FilterChain; import javax.servlet.FilterConfig; import javax.servlet.ServletException; import javax.servlet.ServletRequest; import javax.servlet.ServletResponse;/** * 中文过滤器 */ public class SetCharacterEncodingFilter implements Filter {// ----------------------------------------------------- Instance Variables/** * The default character encoding to set for requests that pass through * this filter. */ protected String encoding = null;/** * The filter configuration object we are associated with. If this value * is null, this filter instance is not currently configured. */ protected FilterConfig filterConfig = null;/** * Should a character encoding specified by the client be ignored? */ protected boolean ignore = true;// --------------------------------------------------------- Public Methods/** * Take this filter out of service. */ public void destroy() {this.encoding = null; this.filterConfig = null;}/** * Select and set (if specified) the character encoding to be used to * interpret request parameters for this request. * * @param request The servlet request we are processing * @param result The servlet response we are creating * @param chain The filter chain we are processing * * @exception IOException if an input/output error occurs * @exception ServletException if a servlet error occurs */ public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException {// Conditionally select and set the character encoding to be used if (ignore || (request.getCharacterEncoding() == null)) { String encoding = selectEncoding(request); if (encoding != null) request.setCharacterEncoding(encoding); }// Pass control on to the next filter chain.doFilter(request, response);}/** * Place this filter into service. * * @param filterConfig The filter configuration object */ public void init(FilterConfig filterConfig) throws ServletException {this.filterConfig = filterConfig; this.encoding = filterConfig.getInitParameter(encoding); String value = filterConfig.getInitParameter(ignore); if (value == null) this.ignore = true; else if (value.equalsIgnoreCase(true)) this.ignore = true; else if (value.equalsIgnoreCase(yes)) this.ignore = true; else this.ignore = false;}// ------------------------------------------------------ Protected Methods/** * Select an appropriate character encoding to be used, based on the * characteristics of the current request and/or filter initialization * parameters. If no character encoding should be set, return * <code>null</code>. * <p> * The default implementation unconditionally returns the value configured * by the <strong>encoding</strong> initialization parameter for this * filter. * * @param request The servlet request we are processing */ protected String selectEncoding(ServletRequest request) {return (this.encoding);}}//EOC 该代码来自于www.javawebstudio.com,特此感谢!然后我们在web.xml中加一些配置,就可以了,配置如下:<filter> <filter-name>Set Character Encoding</filter-name> <filter-class>javawebstudio.struts_db.SetCharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>GBK</param-value> </init-param> <init-param> <param-name>ignore</param-name> <param-value>true</param-value> </init-param> </filter><filter-mapping> <filter-name>Set Character Encoding</filter-name> <servlet-name>action</servlet-name> </filter-mapping>放在web.xml的合适位置。一般在最后,<jsp-config>标签之前(如果有的话)经过以上步骤,JSP和mysql的中文显示及插入就都正常了。在STRUTS中也正常。但是,此时如果你用EMS或mysql的命令行控制台来看表中的数据,却发现它们都是????。这是怎么回事呢?不用担心,只要我们运行下面的这几行命令,就能看到正常的中文了!SET character_set_client = gbk; SET character_set_connection = gbk; SET character_set_database = gbk; SET character_set_results = gbk; SET character_set_server = gbk;SET collation_connection = gbk_bin; SET collation_database = gbk_bin; SET collation_server = gbk_bin;如果你用的是mysql的命令行,则直接输入就好。如果是EMS,则在工具栏中有一个Show SQL Editor按钮,点一下,把上面的命令输入,再按一个execute的按钮,就行了!而且在这种情况下,你可以甚至可以用中文名来建数据库,表名和字段名!!!!----------------------------------------------------------------------------------------------------但是有一点要特别注意!像GBK,UTF-8这样的名字,在mysql与JAVA中有不同的规定,写的时候要格外注意,否则会出错。比如GBK,在JAVA中要写成GBK,但在mysql中要写成gbk(连接数据库的URL)比如UTF-8,在JAVA中要写成UTF-8,但在Mysql中要写成utf8其它的字集符也有类似的区别
如果在 windows 下,在
MySQL 工具或者命令提示符 快捷方式 => 属性 => 选项 => 当前代码页
改为 utf8 就可以了。如果是在 linux 的控制台下,你只需要修改环境变量
export LANG=zh_CN.UTF8
就可以了。更多关于编码的原理,推荐参考一篇通俗易懂的文章:
http://www.regexlab.com/zh/encoding.htm
中没有 utf8 这一项可选。找办法ing……
sswater(光杆兵)提到的方法,确实没有UTF-8选项````````只有两项```,等待解决方法中```````
自从以前学习JSP开始,中文乱码问题就一直不断,苦不堪言。这次在项目开始之前,我们要解决的第一个问题就是把mysql的中文乱码问题搞定。经过多天的努力,终于成功的解决了中文乱码问题,特写在这里,以备后用。软件及环境:Windows XP(2000), j2sdk1.4.2, Tomcat 5.0.25, mysql 4.1, EMS Mysql Manager 2(方便建表,版本2.8.5.1),驱动为mysql-connector-java-3.1.4-beta-bin.jar。目标:在该环境下,实现中文的正常显示,读取与插入数据库。注:我只在此环境下测试通过,别的系统及不同版本未测试要点:统一字符集(JSP页面编码,mysql建库时字符集选择,连接数据库URL,request设定等)下面我以GBK为例讲解。如果要使用utf-8,只要在相应的GBK处换成utf-8即可--------------------------- 步骤1 以GBK字符集建库建表 -------------------------------------我使用EMS来建mysql的数据库及表,因为它是图形界面,方便操作(就像SQL SERVER 2000中的企业管理器一样)。建库时,从EMS菜单中选create Database...新建一个数据库,CharacterSet选gbk_bin(另一个gbk_chinese_ci不知道与这个有什么区别,我找资料也没有找到。如果你知道,请告诉我,我补充在这里)。不要把工具栏上有一个加号和数据库模样的图标当成新建数据库了,那个新注册一个已经存在的数据库。
后面建表时,也要选择同样的字符集。建好后,此时不要用EMS向里面插入数据,否则你看到的中文依然是乱码。--------------------------- 步骤2 连接数据库的URL后加些参数 -------------------------------假设我新建的数据库是testdb,那么我连接数据库的url应该为:jdbc:mysql://localhost:3306/testdb?useUnicode=true&characterEncoding=gbk此时要注意:如果我是把这个url写在JAVA代码中,就直接这样写。但如果是在xml配置文件中(如struts-config.xml,web.xml等),要把其中的&改为&才行,否则会出错。也就是:jdbc:mysql://localhost:3306/testdb?useUnicode=true&characterEncoding=gbk--------------------------- 步骤3 每个JSP页面都要声明该中文字符集 ----------------------------在每个JSP页面的最上面都加上一句<%@ page language=java contentType=text/html;charset=GBK %>这样才能保证JSP页面中的中文显示正常--------------------------- 步骤4 加一个传递参数时设定request字符集的filter类 -----------------------因为网络中字符在传递的时候,都是统一以iso-8859-1的编码传递,所以我们必须对request重新设定字符集,才能正常显示中文。如果采用filter类来实现,我们不用在每次取中文参数时都要重新设定。filter类的内容:/*
* ====================================================================
*
* JavaWebStudio 开源项目
*
* Struts_db v0.1
*
* ====================================================================
*/
package com.strutsLogin.util;import java.io.IOException;import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;/**
* 中文过滤器
*/
public class SetCharacterEncodingFilter implements Filter {// ----------------------------------------------------- Instance Variables/**
* The default character encoding to set for requests that pass through
* this filter.
*/
protected String encoding = null;/**
* The filter configuration object we are associated with. If this value
* is null, this filter instance is not currently configured.
*/
protected FilterConfig filterConfig = null;/**
* Should a character encoding specified by the client be ignored?
*/
protected boolean ignore = true;// --------------------------------------------------------- Public Methods/**
* Take this filter out of service.
*/
public void destroy() {this.encoding = null;
this.filterConfig = null;}/**
* Select and set (if specified) the character encoding to be used to
* interpret request parameters for this request.
*
* @param request The servlet request we are processing
* @param result The servlet response we are creating
* @param chain The filter chain we are processing
*
* @exception IOException if an input/output error occurs
* @exception ServletException if a servlet error occurs
*/
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain)
throws IOException, ServletException {// Conditionally select and set the character encoding to be used
if (ignore || (request.getCharacterEncoding() == null)) {
String encoding = selectEncoding(request);
if (encoding != null)
request.setCharacterEncoding(encoding);
}// Pass control on to the next filter
chain.doFilter(request, response);}/**
* Place this filter into service.
*
* @param filterConfig The filter configuration object
*/
public void init(FilterConfig filterConfig) throws ServletException {this.filterConfig = filterConfig;
this.encoding = filterConfig.getInitParameter(encoding);
String value = filterConfig.getInitParameter(ignore);
if (value == null)
this.ignore = true;
else if (value.equalsIgnoreCase(true))
this.ignore = true;
else if (value.equalsIgnoreCase(yes))
this.ignore = true;
else
this.ignore = false;}// ------------------------------------------------------ Protected Methods/**
* Select an appropriate character encoding to be used, based on the
* characteristics of the current request and/or filter initialization
* parameters. If no character encoding should be set, return
* <code>null</code>.
* <p>
* The default implementation unconditionally returns the value configured
* by the <strong>encoding</strong> initialization parameter for this
* filter.
*
* @param request The servlet request we are processing
*/
protected String selectEncoding(ServletRequest request) {return (this.encoding);}}//EOC
该代码来自于www.javawebstudio.com,特此感谢!然后我们在web.xml中加一些配置,就可以了,配置如下:<filter>
<filter-name>Set Character Encoding</filter-name>
<filter-class>javawebstudio.struts_db.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>GBK</param-value>
</init-param>
<init-param>
<param-name>ignore</param-name>
<param-value>true</param-value>
</init-param>
</filter><filter-mapping>
<filter-name>Set Character Encoding</filter-name>
<servlet-name>action</servlet-name>
</filter-mapping>放在web.xml的合适位置。一般在最后,<jsp-config>标签之前(如果有的话)经过以上步骤,JSP和mysql的中文显示及插入就都正常了。在STRUTS中也正常。但是,此时如果你用EMS或mysql的命令行控制台来看表中的数据,却发现它们都是????。这是怎么回事呢?不用担心,只要我们运行下面的这几行命令,就能看到正常的中文了!SET character_set_client = gbk;
SET character_set_connection = gbk;
SET character_set_database = gbk;
SET character_set_results = gbk;
SET character_set_server = gbk;SET collation_connection = gbk_bin;
SET collation_database = gbk_bin;
SET collation_server = gbk_bin;如果你用的是mysql的命令行,则直接输入就好。如果是EMS,则在工具栏中有一个Show SQL Editor按钮,点一下,把上面的命令输入,再按一个execute的按钮,就行了!而且在这种情况下,你可以甚至可以用中文名来建数据库,表名和字段名!!!!----------------------------------------------------------------------------------------------------但是有一点要特别注意!像GBK,UTF-8这样的名字,在mysql与JAVA中有不同的规定,写的时候要格外注意,否则会出错。比如GBK,在JAVA中要写成GBK,但在mysql中要写成gbk(连接数据库的URL)比如UTF-8,在JAVA中要写成UTF-8,但在Mysql中要写成utf8其它的字集符也有类似的区别
其实,正常的情况,字符串放入数据库前或者从数据库读出后,是不需要进行转化的。搂主所谓的 GBKtoISO 是不是指:new String(string.getBytes("GBK"), "iso-8859-1")其实这样的做法是不好的,关于这一点的详细说明,推荐搂主看一篇文章,看了以后,相信搂主就可以明白为什么是乱码了:
http://www.regexlab.com/zh/encoding.htm
sswater(光杆兵)提到new String(string.getBytes("GBK"), "iso-8859-1"),我的确是用这种方法转换的``
后来我全部编码为gb2312(包括JSP,mysql,)以及servlet内用request.setCharacterEncoding("gb2312")```````
主要是要把jsp中的方法action为post而不是get,最终解决编码为gb2312的问题,可喜可贺`````````````````````````呵呵`````
至于编码为UTF-8问题我还没有尝试,个人认为应该是tomcat5.0问题,它默认为ISO8859-1编码,而IE为utf-9发送的问题,是否这样,有待验证,等有结果出来,再回帖```````````
http://www.regexlab.com/zh/encoding.htm
(但是楼主使用的 GBKtoISO() 是不对的,应该是不进行任何转化)ini 配置如下:[mysql]
# 这个地方设置的是控制台编码,并不是客户端与服务器交互的编码
default-character-set=gbk[mysqld]
# 这个地方设置的是数据库中存放数据采用的编码
default-character-set=utf8
SET character_set_client = utf8;
SET character_set_connection = utf8;
SET character_set_database = utf8;
SET character_set_results = utf8;
SET character_set_server = utf8;SET collation_connection = utf8;
SET collation_database = utf8;
SET collation_server = utf8;同时也在
[mysql]
# 这个地方设置的是控制台编码,并不是客户端与服务器交互的编码
default-character-set=[mysql]
# 这个地方设置的是控制台编码,并不是客户端与服务器交互的编码
default-character-set=utf8[mysqld]
# 这个地方设置的是数据库中存放数据采用的编码
default-character-set=utf8
[mysqld]
# 这个地方设置的是数据库中存放数据采用的编码
default-character-set=utf8
设置
是不经任何转换如(GBKtoISO() ),只要把action="get"改为action="post"就解决,如用action="get则为输出乱码````````
http://tomcat.apache.org/tomcat-4.1-doc/config/coyote.html
http://tomcat.apache.org/tomcat-5.0-doc/config/http.html