影响ORACLE汉字显示的字符集问题 
中原油田研究院 
康子明 等4人 
---- 在国内外大中型数据库管理系统中,把ORACLE作为数据库管理平台的用户比较多。ORACLE 不论是数据库管理能力还是安全性都是无可非议的,但是,它在汉字信息的显示方面着实给中国用户带来不少麻烦,笔者多年从事ORACLE数据库管理,经常收到周围用户和外地用户反映有关ORACLE数据库汉字显示问题的求援信,主要现象是把汉字显示为不可识别的乱码,造成原来大量信息无法使用。本文将就这一问题产生的原因和解决办法进行一些探讨,供存在这方面问题的用户朋友参考。 ---- 1、原因分析 ---- 通过对用户反映情况的分析,发现字符集的设置不当是影响ORACLE数据库汉字显示的关键问题。那么字符集是怎么一会事呢?字符集是ORACLE 为适应不同语言文字显示而设定的。用于汉字显示的字符集主要有ZHS16CGB231280,US7ASCII,WE8ISO8859P1等。字符集不仅需在服务器端存在,而且客户端也必须有字符集注册。服务器端,字符集是在安装ORACLE时指定的,字符集登记信息存储在ORACLE数据库字典的V$NLS_PARAMETERS表中;客户端,字符集分两种情况,一种情况是sql*net 2.0以下版本,字符集是在windows的系统目录下的oracle.ini文件中登记的;另一种情况是sql*net 2.0以上(即32位)版本,字符集是在windows的系统注册表中登记的。要在客户端正确显示ORACLE 数据库汉字信息,首先必须使服务器端的字符集与客户端的字符集一致;其次是加载到ORACLE数据库的数据字符集必须与服务器指定字符集一致。因此,把用户存在的问题归纳分类,产生汉字显示异常的原因大致有以下几种: ---- 1. 1服务器指定字符集与客户字符集不同,而与加载数据字符集一致。 ---- 这种情况是最常见的,只要把客户端的字符集设置正确即可,解决办法见2.1。 ---- 1. 2服务器指定字符集与客户字符集相同,与加载数据字符集不一致。 ---- 这类问题一般发生在ORACLE版本升级或重新安装系统时选择了与原来服务器端不同的字符集,而恢复加载的备份数据仍是按原字符集卸出的场合,以及加载从其它使用不同字符集的ORACLE数据库卸出的数据的情况。这两种情况中,不管服务器端和客户端字符集是否一致都无法显示汉字。解决办法见2.2。 ---- 1.3服务器指定字符集与客户字符集不同,与输入数据字符集不一致。 ---- 这种情况是在客户端与服务器端字符集不一致时,从客户端输入了汉字信息。输入的这些信息即便是把客户端字符集更改正确,也无法显示汉字。解决办法见2.3。 ---- 2.解决办法 ---- 下面将分别对上述三种情况给出解决办法。为了叙述方便,假设客户端使用WINDOWS95/98环境,并已成功地配置了TCP/IP协议,安装了ORACLE的sql*net,sql*pluse产品。 ---- 2.1 设置客户端字符集与服务器端字符集一致 ---- 假设当前服务器端使用US7ASCII字符集。 ---- (1)查看服务器端字符集 ---- 通过客户端或服务器端的sql*plus登录ORACLE的一个合法用户,执行下列SQL语句:    SQL > select * from V$NLS_PARAMETERS 
parameter             value
NLS_LANGUAGE                   AMERICAN
NLS_TERRITORY                  AMERICA
….                             ….
NLS_CHARACTERSET               US7ASCII
NLS_SORT                       BINARY
NLS_NCHAR_CHARACTERSET         US7ASCII---- 从上述列表信息中可看出服务器端ORACLE数据库的字符集为'US7ASCII'。 ---- (2)按照服务器端字符集对客户端进行配置 ---- 配置方法有两种: 安装ORACLE的客户端软件时指定
---- 在安装ORACLE的客户端产品软件时,选择与ORACLE服务端一致的字符集(本例为US7ASCII)即可。 修改注册信息的方法
---- 根据ORACLE 客户端所选sql*net 的版本分为下列两种情况: ---- a. 客户端为 sql*net 2.0 以下版本 ---- 进入Windows的系统目录,编辑oracle.ini文件,用US7ASCII替换原字符集,重新启动计算机,设置生效。 ---- b. 客户端为 sql*net 2.0 以上版本 ---- 在WIN98 下 运 行REGEDIT,第一步选HKEY_LOCAL_MACHINE,第二步选择SOFTWARE, 第三步选择 ORACLE, 第四步选择 NLS_LANG, 键 入 与服 务 器 端 相 同 的 字 符 集(本例为:AMERICAN_AMERICAN.US7ASCII)。 ---- 2.2 强制加载数据字符集与服务器端字符集一致 ---- 假设要加载数据从原ORACLE数据库卸出时的字符集为US7ASCII,当前ORACLE服务器字符集为WE8ISO8859P1。 ---- 下面提供三种解决方法: ---- (1) 服务器端重新安装ORACLE ---- 在重新安装ORACLE 时选择与原卸出数据一致的字符集(本例为US7ASCII)。 ---- 加载原卸出的数据。 ---- 这种情况仅仅使用于空库和具有同一种字符集的数据。 ---- (2)强行修改服务器端ORACLE当前字符集 ---- 在用imp命令加载数据前,先在客户端用sql*plus登录system DBA用户,执行下列SQL语句进行当前ORACLE数据库字符集修改:  SQL > create database  character set US7ASCII
* create database character set US7ASCII
      ERROR at line 1:
ORA-01031: insufficient privileges---- 你会发现语句执行过程中,出现上述错误提示信息,此时不用理会,实际上ORACLE数据库的字符集已被强行修改为US7ASCII,接着用imp命令装载数据。等数据装载完成以后,shutdown 数据库,再startup 数据库,用合法用户登录ORACLE数据库,在sql>命令提示符下,运行select * from V$NLS_PARAMETERS,可以看到ORACLE数据库字符集已复原,这时再查看有汉字字符数据的表时,汉字已能被正确显示。 ---- (3)利用数据格式转储,避开字符集限制 ---- 这种方法主要用于加载外来ORACLE数据库的不同字符集数据。其方法如下: ---- 先将数据加载到具有相同字符集的服务器上,然后用转换工具卸出为foxbase 格式或access格式数据库,再用转换工具转入到不同字符集的ORACLE数据库中,这样就避免了ORACLE字符集的困扰。目前数据库格式转换的工具很多,象power builder5.0以上版本提供的pipeline,Microsoft Access数据库提供的数据导入/导出功能等。转换方法参见有关资料说明。. ---- 2.3匹配字符集替换汉字 ---- 对于1.3提到的情况,没有很好的办法,只能先把客户端与服务器端字符集匹配一致后,根据原输入汉字的特征码替换汉字字符部分。

解决方案 »

  1.   


    4.查看字符集参数 
    4.1查看Oracle 8.0.5 for Windows NT props$内容 
    SQL> connect sys/change_on_install 
    SQL> col value$ format a40 
    SQL> select name,value$ from props$; 
    NAME              value$ 
    --------------------------------------- 
    DICT.BASE            2 
    NLS_LANGUAGE           AMERICAN 
    NLS_TERRITORY          AMERICA 
    NLS_CURRENCY           $ 
    NLS_ISO_CURRENCY         AMERICA 
    NLS_NUMERIC_CHARACTERS     ., 
    NLS_CALENDAR           GREGORIAN 
    NLS_DATE_formAT         DD-MON-YY 
    NLS_DATE_LANGUAGE        AMERICAN 
    NLS_CHARACTERSET         ZHS16GBK 
    NLS_SORT            BINARY 
    NLS_NCHAR_CHARACTERSET     ZHS16GBK 
    NLS_RDBMS_VERSION        8.0.5.0.0 
    GLOBAL_DB_NAME         ORACLE.WORLD 
    EXPORT_VIEWS_VERSION      7 
    已选择15行。 4.2查看Oracle 8.0.4 for Digital UNIN 的props$内容 
    SQL> connect sys/change_on_install 
    SQL> col value$ format a40 
    SQL> select name,value$ from props$; 
    NAME              value$ 
    --------------------------------------- 
    DICT.BASE            2 
    NLS_LANGUAGE           AMERICAN 
    NLS_TERRITORY          AMERICA 
    NLS_CURRENCY           $ 
    NLS_ISO_CURRENCY         AMERICA 
    NLS_NUMERIC_CHARACTERS      ., 
    NLS_CALENDAR           GREGORIAN 
    NLS_DATE_formAT         DD-MON-YY 
    NLS_DATE_LANGUAGE        AMERICAN 
    NLS_CHARACTERSET         ZHS16CGB231280 
    NLS_SORT             BINARY 
    NLS_NCHAR_CHARACTERSET      ZHS16CGB231280 
    NLS_RDBMS_VERSION        8.0.4.0.0 
    GLOBAL_DB_NAME          ORCL.WORLD 
    EXPORT_VIEWS_VERSION      7 
    15 rows selected. 
    发现Oracle 8.0.4 for Digital UNIN 采用了Oracle在Digital Unix环境下建议的中文字符集ZHS16CGB231280,两者的字符集不同,于是本人就在Digital UNIN服务器上重新安装Oracle,选择了与NT上同样的字符集ZHS16GBK(中国简体汉字16位国标库)。安装完成后,通过查看props$的内容,确认了Oracle 8.0.4 for Digital UNIN和Oracle 8.0.5 for Windows NT的字符集一致。于是用Oracle 8.0.4 for Digital UNIN的导入工具imp重新进行数据导入,但还是报同样的错误,问题还未得到解决。 5.问题解决办法 
    后来本人发现在Oracle 8.0.5 for Windows NT的服务器(或装有Oracle 8.0.5 for windows 95/98的工作站)上直接用Oracle 8.0.5 for Windows NT的导入工具imp80远程对Oracle 8.0.4 for Digital UNIN数据库进行数据导入,问题竟得到解决。 
    5.1在NT的服务器上,修改tnsnames.ora(或通过Oracle Net8 Easy config)设置数据库连接字符串gxmis(可自行设定)指向Oracle 8.0.4 for Digital UNIN服务器。 5.2在NT的服务器上进行数据远程导入 
    c:>imp80 gxmisdba/manager@gxmis file=c:expdat.dmpfull=y log=c:import.log 已连接到:Oracle8 Enterprise Edition Release 8.0.4.0.0 - Production 
    PL/SQL Release 8.0.4.0.0 - Production 
    经由常规路径导出由EXPORT:V08.00.05创建的文件 
    . 正在将GXMISDBA的对象导入到 GXMISDBA 
    . . 正在导入表 "AAAAA" 0行被导入 
    . . 正在导入表 "EVT_CARRIER_CONFIGURATION" 0行被导入 
    . . 正在导入表 "TBL_AJ_AGKS" 331行被导入 



    准备启用约束条件... 
    成功终止导入 5.3把Oracle 8.0.4 for Digital UNIN字符集重新又改成ZHS16CGB231280,进行数据远程导入测试,数据也同样地导入成功。说明ZHS16CGB231280字符集可以兼容ZHS16GBK字符集。 6.经验总结 
    6.1在Oracle 8.0.4 for Digital UNIN服务器上(字符集ZHS16GBK)用8.0.4 for Digital UNIN的导出工具exp将已正常(即可存储和显示中文)的数据库导出。 
    $ exp gxmisdba/manager file=/u01/expdat.dmp log=/u01/export.log 
    显示成功导出。 
    在用Oracle 8.0.4 for Digital UNIN的导入工具imp进行导入 
    $imp gxmisdba/manager file=/u01/expdat.dmp full=y log=u01import.log 
    错误又重现。 6.2在NT服务器上通过ftp命令将在Oracle 8.0.4 for Digital UNIN服务器上刚导出的输出转存二进制文件expdat.dmp下载至NT服务器上,用imp80进行远程导入。 
    c:>imp80 gxmisdba/manager@gxmis file=c:expdat.dmp full=y log=c:import.log 
    已连接到:Oracle8 Enterprise Edition Release 8.0.4.0.0 – Production 
    PL/SQL Release 8.0.4.0.0 – Production 
    IMP-00016: 不支持要求的字符集转换(从类型1到852) 
    IMP-00000: 未成功终止导入 6.3在NT服务器上对Digital UNIN服务器上的数据进行远程导出(备份) 
    c:>exp80 gxmisdba/manager@gxmis file=c:expdat.dmp log=c:export.log 
    显示成功导出。再进行远程导入 
    c:>imp80 gxmisdba/manager@gxmis file=c:expdat.dmp full=y log=c:import.log 
    显示成功导入。通过客户端Oracle Sql Plus查看中文显示正常。 
    从而说明在Oracle 8.0.4 for Digital UNIN服务器上对含有中文的数据库的数据移植、备份、数据恢复不要用Oracle 8.0.4 for Digital UNIN本身自带的导入导出工具imp,exp,应使用能进行中文导入导出的工具,如imp80,exp80。 江西思创数码科技有限公司 江恭和