字符编码问题,想搞清楚 我有个地方考试站,目标用户就是我本地的,今天做到外语类时,发现外语有日语等。当初以为目标用户是本地的,用GBK就够了,现在有点困惑,用GBK保存其他外语会不会有问题?采集了日语内容保存到GBK的数据表中,好像也没什么问题,不知道是不是必须用UTF8? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 GBK 共收入21886个汉字和图形符号,包括:GB2312 中的全部汉字、非汉字符号。BIG5 中的全部汉字。与 ISO-10646 相应的国家标准 GB13000 中的其它 CJK 汉字,以上合计 20902 个汉字。其它汉字、部首、符号,共计 984 个。也就是gbk使用的时候,中日韩的都还行,但是如果有中日韩之外的话,还是要用UTF8(例如维族文字) 汉语编码常用两种,GBK(Gb2312)/Big5,常用字体为宋体/Mingliu日语编码常用两种,Shift-JIS/EUC-JP,常用字体为MS Gothic/ euc-jp为半角字体,很少也很难研究韩语编码常用一种,EUC-KR,常用字体为Gulimche它们的内码都使用[\x8140-\xfefe]实际上,中韩两种语言的win系统都是在日语win系统的基础上改造出来的单独使用时,内码的各自保存并不冲突,只需要显示时声明编码方式和使用适当的字体----------------------------------------混合使用是另一种情况GBK的字符包含几乎全部big5的字符、常用的日语50音字符(全角的平假、片假)及日语中绝大部分汉字,也包含韩语中绝大部分汉字字符,但不包含特殊的日语字符和所有韩语字符GBK操作系统使用big5编码时也不能显示big5里面的日语字符(平假片假字符)如果GBK系统显示 混合简繁/汉语和shift-jis,把后者转为gbk相应字符没多大问题但gbk混合韩语,就是说既要显示韩文中没有的汉字,又要显示韩文时,ansi就不能完成这个工作了例如:中文的题目,里面要求翻译韩文(那就要显示韩文)了,这种情况就困难了另外新加坡的汉字编码接触不多,上面没有提及建议还是尽可能使用utf-8 明白了,看来我还得转换成UTF8才行 地方考试站,适用就可以了,,,,,GBK编码不小了,中日韩的常用字符没啥问题,换成UTF-8数据库会增加几乎50%没记错的话,天涯网好像就是GBK的 体积增加也是值得的,最起码能省去不少麻烦事,效率方便为主,硬件方面暂时不要考虑,看看家用电脑市场上40G->80G->160G->250G->500G->1T的硬盘容量递增的速度有多快,服务器级的就更不用说了,对于喜欢效率的朋友来说,真的多少可以忽略这个问题了!只要方便好用能简化工作量,我是宁可多花钱把体积整大,也不愿意花太多时间在编码问题上折腾自己! 双字节->三字节,当然add 50%我以前说过,速度和效率是钱砸出来的,程序只是整个业务流程的一环,做好自己的优化就足够了,业务流程是会变的。弄台低端的服务器,就算你比方校长更强也是忽略不计的 淘宝、阿里巴巴中国全是GBK,你的用户群覆盖能超过它们?他们技术架构时候,应该也考虑到外文介绍吧?例如某款国外商品对一般的技术来说,非实验研究目的,老老实实写,就不用考虑编码问题了,这都有问题,更是技术本身的问题对一个运营的网站,突然从GBK=>UTF-8编码,搜索引擎收录会不会出问题?技术倒省事了,万一收录量、权重降了你哭都来不及,小站点不是淘宝,没有资本拒绝百度蜘蛛,不过这个会不会影响我没测试过。,我还是那句话,适用就可以了 各有各的道理啦从运营中途突然改编码确实是个大问题,但如果一开始就做这个工作,考虑一下还是需要的淘宝,阿里巴巴中国(阿里巴巴主站是utf-8的)客户量很大,但区域就可能仅仅面向国内,海外用户他们是另外有方案的,这点反而中小站难以学习,中小站都做几套语言方案么?淘宝上面用韩文介绍产品估计不到1/10000(让客户自己做图片好了),日语的话只要在gbk状态下输入,自然就转化gbk中的日语字符(特殊的日语字符应该也没几个人用到)阿里巴巴如果要用韩语介绍产品,不会进入中国区方案的中国百度用的是GB2312,日本百度用的却是utf-8,为何不用双字节的shift-jis?我估计后者从一开始就部署unicode了,前者要么部署时方案是GBK,要么就是完全忽略unicode了还是那句话,业务流程在变,技术怎么办?楼主的GBK怎么显示韩文翻译的题目?例如题目:请把“대한민국”翻译成汉语?虽然客户端没有韩语字体的时候照样无法显示但对楼主来说,怎么入库?怎么输出?把대한민국做成图片么?还是以&#xxxxx;的方式? 做数据库的结构首先就要看的长远, 多国字符的话, UTF8是必需的 欢迎争论。 随便说一句,永远支持utf8 UTF8编码应是国际化的大势所趋 支持UTF8 谢谢各位,我已经将数据库转换为UTF8了 织梦的模板标签里怎么用php引用标签里的变量 checking for gnutls support in libcurl... no 关于SVN服务器搭建的重重问题,在线等...... 有一条SQL 怎样能取出这条SQL WHERE 的所有字段? 高手进来帮忙看下,哪里出问题了 关于网上支付程序接口 socket错误。 新手提问 我找不到办法解决!谢谢帮忙! php 使用ajax发送密码过去,接收端发现密码被裁剪了 请问这段代码为什么不能控制 关于缓存控制
GB2312 中的全部汉字、非汉字符号。
BIG5 中的全部汉字。
与 ISO-10646 相应的国家标准 GB13000 中的其它 CJK 汉字,以上合计 20902 个汉字。
其它汉字、部首、符号,共计 984 个。也就是gbk使用的时候,中日韩的都还行,但是如果有中日韩之外的话,还是要用UTF8(例如维族文字)
日语编码常用两种,Shift-JIS/EUC-JP,常用字体为MS Gothic/ euc-jp为半角字体,很少也很难研究
韩语编码常用一种,EUC-KR,常用字体为Gulimche它们的内码都使用[\x8140-\xfefe]实际上,中韩两种语言的win系统都是在日语win系统的基础上改造出来的单独使用时,内码的各自保存并不冲突,只需要显示时声明编码方式和使用适当的字体----------------------------------------
混合使用是另一种情况GBK的字符包含几乎全部big5的字符、常用的日语50音字符(全角的平假、片假)及日语中绝大部分汉字,
也包含韩语中绝大部分汉字字符,但不包含特殊的日语字符和所有韩语字符GBK操作系统使用big5编码时也不能显示big5里面的日语字符(平假片假字符)如果GBK系统显示 混合简繁/汉语和shift-jis,把后者转为gbk相应字符没多大问题
但gbk混合韩语,就是说既要显示韩文中没有的汉字,又要显示韩文时,ansi就不能完成这个工作了
例如:中文的题目,里面要求翻译韩文(那就要显示韩文)了,这种情况就困难了另外新加坡的汉字编码接触不多,上面没有提及建议还是尽可能使用utf-8
双字节->三字节,当然add 50%我以前说过,速度和效率是钱砸出来的,程序只是整个业务流程的一环,做好自己的优化就足够了,业务流程是会变的。弄台低端的服务器,就算你比方校长更强也是忽略不计的
这点反而中小站难以学习,中小站都做几套语言方案么?
淘宝上面用韩文介绍产品估计不到1/10000(让客户自己做图片好了),日语的话只要在gbk状态下输入,自然就转化gbk中的日语字符(特殊的日语字符应该也没几个人用到)
阿里巴巴如果要用韩语介绍产品,不会进入中国区方案的中国百度用的是GB2312,日本百度用的却是utf-8,为何不用双字节的shift-jis?
我估计后者从一开始就部署unicode了,前者要么部署时方案是GBK,要么就是完全忽略unicode了
还是那句话,业务流程在变,技术怎么办?
楼主的GBK怎么显示韩文翻译的题目?例如题目:请把“대한민국”翻译成汉语?
虽然客户端没有韩语字体的时候照样无法显示
但对楼主来说,怎么入库?怎么输出?把대한민국做成图片么?还是以&#xxxxx;的方式?
UTF8编码应是国际化的大势所趋 支持UTF8