要学会自己搜索。建议在http://www.google.com上search
详情见http://www.unicode.org/unicode/standard/translations/s-chinese.html
什么是Unicode(统一码)?
Unicode给每个字符提供了一个唯一的数字,
不论是什么平台,
不论是什么程序,
不论是什么语言。基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。Unicode正在改变所有这一切!
Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。将Unicode与客户服务器或多层应用程序和网站结合,比使用传统字符集节省费用。Unicode使单一软件产品或单一网站能够贯穿多个平台,语言和国家,而不需要重建。它可将数据传输到许多不同的系统,而无损坏。关于Unicode学术学会
Unicode学术学会是一个非盈利的组织,是为发展,扩展和推广使用Unicode标准而建立的,Unicode学术学会设立了现代软件产品和标准文本的表示法。学术学会的会员代表了广泛领域的计算机和资讯工业的公司和组织。学术学会只由会员提供资金。Unicode学术学会的会员资格开放给世界上任何支持Unicode标准和希望协助其扩展和执行的组织及个人。欲知更多信息,请参阅术语词汇表,Unicode产品样本,技术简介和参考资料。

解决方案 »

  1.   

    operating system: can not support win9x?
      

  2.   

    Unicode :宽字节字符集
    1. 如何取得一个既包含单字节字符又包含双字节字符的字符串的字符个数?
    可以调用Microsoft Visual C++的运行期库包含函数_mbslen来操作多字节(既包括单字节也包括双字节)字符串。
    调用strlen函数,无法真正了解字符串中究竟有多少字符,它只能告诉你到达结尾的0之前有多少个字节。
    2. 如何对DBCS(双字节字符集)字符串进行操作?
    函数 描述
    PTSTR CharNext ( LPCTSTR ); 返回字符串中下一个字符的地址
    PTSTR CharPrev ( LPCTSTR, LPCTSTR ); 返回字符串中上一个字符的地址
    BOOL IsDBCSLeadByte( BYTE ); 如果该字节是DBCS字符的第一个字节,则返回非0值
    3. 为什么要使用Unicode?
    (1) 可以很容易地在不同语言之间进行数据交换。
    (2) 使你能够分配支持所有语言的单个二进制.exe文件或DLL文件。
    (3) 提高应用程序的运行效率。
    Windows 2000是使用Unicode从头进行开发的,如果调用任何一个Windows函数并给它传递一个ANSI字符串,那么系统首先要将字符串转换成Unicode,然后将Unicode字符串传递给操作系统。如果希望函数返回ANSI字符串,系统就会首先将Unicode字符串转换成ANSI字符串,然后将结果返回给你的应用程序。进行这些字符串的转换需要占用系统的时间和内存。通过从头开始用Unicode来开发应用程序,就能够使你的应用程序更加有效地运行。
    Windows CE 本身就是使用Unicode的一种操作系统,完全不支持ANSI Windows函数
    Windows 98 只支持ANSI,只能为ANSI开发应用程序。
    Microsoft公司将COM从16位Windows转换成Win32时,公司决定需要字符串的所有COM接口方法都只能接受Unicode字符串。
    4. 如何编写Unicode源代码?
    Microsoft公司为Unicode设计了WindowsAPI,这样,可以尽量减少代码的影响。实际上,可以编写单个源代码文件,以便使用或者不使用Unicode来对它进行编译。只需要定义两个宏(UNICODE和_UNICODE),就可以修改然后重新编译该源文件。
    _UNICODE宏用于C运行期头文件,而UNICODE宏则用于Windows头文件。当编译源代码模块时,通常必须同时定义这两个宏。
    5. Windows定义的Unicode数据类型有哪些?
    数据类型 说明
    WCHAR Unicode字符
    PWSTR 指向Unicode字符串的指针
    PCWSTR 指向一个恒定的Unicode字符串的指针
    对应的ANSI数据类型为CHAR,LPSTR和LPCSTR。
    ANSI/Unicode通用数据类型为TCHAR,PTSTR,LPCTSTR。
    6. 如何对Unicode进行操作?
    字符集 特性 实例
    ANSI 操作函数以str开头 strcpy
    Unicode 操作函数以wcs开头 wcscpy
    MBCS 操作函数以_mbs开头 _mbscpy
    ANSI/Unicode 操作函数以_tcs开头 _tcscpy(C运行期库)
    ANSI/Unicode 操作函数以lstr开头 lstrcpy(Windows函数)
    所有新的和未过时的函数在Windows2000中都同时拥有ANSI和Unicode两个版本。ANSI版本函数结尾以A表示;Unicode版本函数结尾以W表示。Windows会如下定义:
    #ifdef  UNICODE
    #define  CreateWindowEx  CreateWindowExW
    #else
    #define  CreateWindowEx  CreateWindowExA
    #endif   // !UNICODE
    7. 如何表示Unicode字符串常量?
    字符集 实例
    ANSI “string”
    Unicode L“string”
    ANSI/Unicode T(“string”)或_TEXT(“string”)if( szError[0] == _TEXT(‘J’) ){ }
    8. 为什么应当尽量使用操作系统函数?
    这将有助于稍稍提高应用程序的运行性能,因为操作系统字符串函数常常被大型应用程序比如操作系统的外壳进程Explorer.exe所使用。由于这些函数使用得很多,因此,在应用程序运行时,它们可能已经被装入RAM。
    如:StrCat,StrChr,StrCmp和StrCpy等。
    9. 如何编写符合ANSI和Unicode的应用程序?
    (1) 将文本串视为字符数组,而不是chars数组或字节数组。
    (2) 将通用数据类型(如TCHAR和PTSTR)用于文本字符和字符串。
    (3) 将显式数据类型(如BYTE和PBYTE)用于字节、字节指针和数据缓存。
    (4) 将TEXT宏用于原义字符和字符串。
    (5) 执行全局性替换(例如用PTSTR替换PSTR)。
    (6) 修改字符串运算问题。例如函数通常希望在字符中传递一个缓存的大小,而不是字节。这意味着不应该传递sizeof(szBuffer),而应该传递(sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要为字符串分配一个内存块,并且拥有该字符串中的字符数目,那么请记住要按字节来分配内存。这就是说,应该调用malloc(nCharacters *sizeof(TCHAR)),而不是调用malloc(nCharacters)。
    10. 如何对字符串进行有选择的比较?
    通过调用CompareString来实现。
    标志 含义
    NORM_IGNORECASE 忽略字母的大小写
    NORM_IGNOREKANATYPE 不区分平假名与片假名字符
    NORM_IGNORENONSPACE 忽略无间隔字符
    NORM_IGNORESYMBOLS 忽略符号
    NORM_IGNOREWIDTH 不区分单字节字符与作为双字节字符的同一个字符
    SORT_STRINGSORT 将标点符号作为普通符号来处理
    11. 如何判断一个文本文件是ANSI还是Unicode?
    判断如果文本文件的开头两个字节是0xFF和0xFE,那么就是Unicode,否则是ANSI。
    12. 如何判断一段字符串是ANSI还是Unicode?
    用IsTextUnicode进行判断。IsTextUnicode使用一系列统计方法和定性方法,以便猜测缓存的内容。由于这不是一种确切的科学方法,因此 IsTextUnicode有可能返回不正确的结果。
    13. 如何在Unicode与ANSI之间转换字符串?
    Windows函数MultiByteToWideChar用于将多字节字符串转换成宽字符串;函数WideCharToMultiByte将宽字符串转换成等价的多字节字符串。