是否半角字符,全角汉字,日文汉字都一样

解决方案 »

  1.   

    UTF-8 is the 8-bit encoding of Unicode. It is a variable-width encoding and also a
    strict superset of 7-bit ASCII. A strict superset means that each and every character in 7-bit ASCII is available in UTF-8 with the same corresponding codepoint value.
    One Unicode character can be 1 byte, 2 bytes, 3 bytes or 4 bytes in this encoding.
    Characters from the European scripts are represented in either 1 or 2 bytes;
    characters from most Asian scripts are represented in 3 bytes, while supplementary
    characters are represented in 4 bytes.