严格来说,编码只能猜,不能严格判断比如 一个字符第一位是156, 第二位是177
那么在gbk里它表示中文 湵
在shift-jis里表示 愕但是如果光给你 156,177, 不说编码, 你是无法判断它是哪个的,所以只能根据这些编码的范围,大概猜了
那么在gbk里它表示中文 湵
在shift-jis里表示 愕但是如果光给你 156,177, 不说编码, 你是无法判断它是哪个的,所以只能根据这些编码的范围,大概猜了
To : jiangsheng(蒋晟.Net[MVP]) Encode::Guess 这个好像是perl里面的吧,我只能用PHP实现
To : helloyou0(你好!)
听你这么一说,似乎明白了一点,我试了php扩展库里面的mb_detect_encoding这个函数,但是判断的准确性实在是不尽人意,尤其是在中文和日文的判断上,有没有什么方法可以猜的准确一些?
或者
如果你的网页是分编码的,那来自gbk网页的默认gbk编码,....etc.
或者
或者根据$_SERVER里用户语言来判断上面这些方法再结合mb_detect_encoding, 看看效果如何