我发现
一个utf8格式的汉字是占三个字节的
一个gbk的汉字占两个字节