最近要处理双字节字符, 例如, 中文, 文档格式是以回车换行标示一行的结束的, 如ABC
E中文FG原则上, 我会对该文档的内容转为byte数组, 然后对每个byte进行检查, 如果发现"10"这个byte, 就认为当前行已经结束
但问题是, 如果一行里面包含有中文, 像上面"E中文FG", 而中文是双字节的, 那有没有可能某个中文的第一字节是"10"而令到我的程序有问题呢?因为我被告知中文里面有某些字符是"10"这个字节打头的, 那会是什么中文呢?