找一个占四个字节的UTF8字符,有人知道吗? UTF8的汉字只有两个或三个字节UTF8和unicode并不是一回事 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 UTF8编码是变长字节编码,用1~3个字节表示一个字符。但是Unicode中有所谓的Surrogate Pair,可能需要4个以上的字节才能表示。 Unicode符号范围 | UTF-8编码方式 (十六进制) | (二进制)--------------------+---------------------------------------------0000 0000-0000 007F | 0xxxxxxx0000 0080-0000 07FF | 110xxxxx 10xxxxxx0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 【占四字节部分】 for($i=0; $i<256; $i++) { for($j=0; $j < 256; $j++) { $ch = chr($i) . chr($j); $s = iconv('gbk', 'utf-8', $ch); if(strlen($s) > 3) { echo $ch .'<br>'; } }} php正则表达式 匹配问题 急 请教php高手 UTF8 BOM的问题 关于phplib配置, 文件按格式读写的问题!大家帮忙! 请xuzuning(唠叨) 和 phplover(主动、交流、挑战、责任)进来取走应得分数! 菜鸟问题---如何与oracle连接 php,oracle 如何在php中实现批处理 如何下载试听或试看的RM格试文件 面向对象分析与设计疑问 急!!为什么我装了PHP For win32,在本机打开.php文件还是会变成下载? 请问eclipse如何带get参数调试
但是Unicode中有所谓的Surrogate Pair,可能需要4个以上的字节才能表示。
(十六进制) | (二进制)
--------------------+---------------------------------------------
0000 0000-0000 007F | 0xxxxxxx
0000 0080-0000 07FF | 110xxxxx 10xxxxxx
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 【占四字节部分】
for($j=0; $j < 256; $j++) {
$ch = chr($i) . chr($j);
$s = iconv('gbk', 'utf-8', $ch);
if(strlen($s) > 3) {
echo $ch .'<br>';
}
}
}