我有个地方考试站,目标用户就是我本地的,今天做到外语类时,发现外语有日语等。当初以为目标用户是本地的,用GBK就够了,现在有点困惑,用GBK保存其他外语会不会有问题?采集了日语内容保存到GBK的数据表中,好像也没什么问题,不知道是不是必须用UTF8?

解决方案 »

  1.   

    GBK 共收入21886个汉字和图形符号,包括:
    GB2312 中的全部汉字、非汉字符号。
    BIG5 中的全部汉字。
    与 ISO-10646 相应的国家标准 GB13000 中的其它 CJK 汉字,以上合计 20902 个汉字。
    其它汉字、部首、符号,共计 984 个。也就是gbk使用的时候,中日韩的都还行,但是如果有中日韩之外的话,还是要用UTF8(例如维族文字)
      

  2.   

    汉语编码常用两种,GBK(Gb2312)/Big5,常用字体为宋体/Mingliu
    日语编码常用两种,Shift-JIS/EUC-JP,常用字体为MS Gothic/ euc-jp为半角字体,很少也很难研究
    韩语编码常用一种,EUC-KR,常用字体为Gulimche它们的内码都使用[\x8140-\xfefe]实际上,中韩两种语言的win系统都是在日语win系统的基础上改造出来的单独使用时,内码的各自保存并不冲突,只需要显示时声明编码方式和使用适当的字体----------------------------------------
    混合使用是另一种情况GBK的字符包含几乎全部big5的字符、常用的日语50音字符(全角的平假、片假)及日语中绝大部分汉字,
    也包含韩语中绝大部分汉字字符,但不包含特殊的日语字符和所有韩语字符GBK操作系统使用big5编码时也不能显示big5里面的日语字符(平假片假字符)如果GBK系统显示 混合简繁/汉语和shift-jis,把后者转为gbk相应字符没多大问题
    但gbk混合韩语,就是说既要显示韩文中没有的汉字,又要显示韩文时,ansi就不能完成这个工作了
    例如:中文的题目,里面要求翻译韩文(那就要显示韩文)了,这种情况就困难了另外新加坡的汉字编码接触不多,上面没有提及建议还是尽可能使用utf-8
      

  3.   

    明白了,看来我还得转换成UTF8才行
      

  4.   

    地方考试站,适用就可以了,,,,,GBK编码不小了,中日韩的常用字符没啥问题,换成UTF-8数据库会增加几乎50%没记错的话,天涯网好像就是GBK的
      

  5.   

         体积增加也是值得的,最起码能省去不少麻烦事,效率方便为主,硬件方面暂时不要考虑,看看家用电脑市场上40G->80G->160G->250G->500G->1T的硬盘容量递增的速度有多快,服务器级的就更不用说了,对于喜欢效率的朋友来说,真的多少可以忽略这个问题了!只要方便好用能简化工作量,我是宁可多花钱把体积整大,也不愿意花太多时间在编码问题上折腾自己!
      

  6.   


    双字节->三字节,当然add 50%我以前说过,速度和效率是钱砸出来的,程序只是整个业务流程的一环,做好自己的优化就足够了,业务流程是会变的。弄台低端的服务器,就算你比方校长更强也是忽略不计的
      

  7.   

    淘宝、阿里巴巴中国全是GBK,你的用户群覆盖能超过它们?他们技术架构时候,应该也考虑到外文介绍吧?例如某款国外商品对一般的技术来说,非实验研究目的,老老实实写,就不用考虑编码问题了,这都有问题,更是技术本身的问题对一个运营的网站,突然从GBK=>UTF-8编码,搜索引擎收录会不会出问题?技术倒省事了,万一收录量、权重降了你哭都来不及,小站点不是淘宝,没有资本拒绝百度蜘蛛,不过这个会不会影响我没测试过。,我还是那句话,适用就可以了
      

  8.   

    各有各的道理啦从运营中途突然改编码确实是个大问题,但如果一开始就做这个工作,考虑一下还是需要的淘宝,阿里巴巴中国(阿里巴巴主站是utf-8的)客户量很大,但区域就可能仅仅面向国内,海外用户他们是另外有方案的,
    这点反而中小站难以学习,中小站都做几套语言方案么?
    淘宝上面用韩文介绍产品估计不到1/10000(让客户自己做图片好了),日语的话只要在gbk状态下输入,自然就转化gbk中的日语字符(特殊的日语字符应该也没几个人用到)
    阿里巴巴如果要用韩语介绍产品,不会进入中国区方案的中国百度用的是GB2312,日本百度用的却是utf-8,为何不用双字节的shift-jis?
    我估计后者从一开始就部署unicode了,前者要么部署时方案是GBK,要么就是完全忽略unicode了
    还是那句话,业务流程在变,技术怎么办?
    楼主的GBK怎么显示韩文翻译的题目?例如题目:请把“대한민국”翻译成汉语?
    虽然客户端没有韩语字体的时候照样无法显示
    但对楼主来说,怎么入库?怎么输出?把대한민국做成图片么?还是以&#xxxxx;的方式?
      

  9.   

    做数据库的结构首先就要看的长远, 多国字符的话, UTF8是必需的
      

  10.   

    欢迎争论。 随便说一句,永远支持utf8
      

  11.   


    UTF8编码应是国际化的大势所趋  支持UTF8
      

  12.   

    谢谢各位,我已经将数据库转换为UTF8了