http://blog.oasisfeng.com/2006/10/19/full-cjk-unicode-range/

解决方案 »

  1.   

    2E80~33FFh:中日韩符号区。收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符,中日韩的符号、标点、带圈或带括符文数字、月份,以及日本的假名组合、单位、年号、月份、日期、时间等。3400~4DFFh:中日韩认同表意文字扩充A区,总计收容6,582个中日韩汉字。4E00~9FFFh:中日韩认同表意文字区,总计收容20,902个中日韩汉字。A000~A4FFh:彝族文字区,收容中国南方彝族文字和字根。AC00~D7FFh:韩文拼音组合字区,收容以韩文音符拼成的文字。F900~FAFFh:中日韩兼容表意文字区,总计收容302个中日韩汉字。FB00~FFFDh:文字表现形式区,收容组合拉丁文字、希伯来文、阿拉伯文、中日韩直式标点、小符号、半角符号、全角符号等。比如需要匹配所有中日韩非符号字符,那么正则表达式应该是^[\u3400-\u9FFF]+$ 
    理论上没错, 可是我到msn.co.ko随便复制了个韩文下来, 发现根本不对, 诡异 
    再到msn.co.jp复制了个'お', 也不得行.. 然后把范围扩大到^[\u2E80-\u9FFF]+$, 这样倒是都通过了, 这个应该就是匹配中日韩文字的正则表达式了, 包括我們臺灣省還在盲目使用的繁體中文而关于中文的正则表达式, 应该是^[\u4E00-\u9FFF]+$, 和论坛里常被人提起的^[\u4E00-\u9FA5]+$很接近需要注意的是论坛里说的^[\u4E00-\u9FA5]+$这是专门用于匹配简体中文的正则表达式, 实际上繁体字也在里面, 我用测试器测试了下'中華人民共和國', 也通过了, 当然, ^[\u4E00-\u9FFF]+$也是一样的结果
      

  2.   

    http://community.csdn.net/Expert/topic/5485/5485081.xml?temp=.786709
      

  3.   

    http://community.csdn.net/Expert/topic/5485/5485081.xml?temp=.786709
    看了这个帖子
    \xa1-\xff  中文
    \x80-\xff  中文\x80-\xff不是包括\xa1-\xff吗?
      

  4.   

    没人告诉我第二人问题吗?\x80-\xff不是包括\xa1-\xff吗?
      

  5.   

    U0000 ASCII.pdf
    U0A00.pdf
    U0A80.pdf
    U0B00.pdf
    U0B80.pdf
    U0C00.pdf
    U0C80.pdf
    U0D00.pdf
    U0D80.pdf
    U0E00.pdf
    U0E80.pdf
    U0F00.pdf
    U1A00.pdf
    U1B00.pdf
    U1D000.pdf
    U1D00.pdf
    U1D80.pdf
    U1D100.pdf
    U1D200.pdf
    U1D300.pdf
    U1D360.pdf
    U1D400.pdf
    U1DC0.pdf
    U1E00.pdf
    U1F00.pdf
    U1FF80.pdf
    U2A00 扩展数学符号.pdf
    U02B0.pdf
    U2B00.pdf
    U2C00.pdf
    U2C60.pdf
    U2C80.pdf
    U2D00.pdf
    U2D30.pdf
    U2D80.pdf
    U2E00.pdf
    U2E80.pdf
    U2F00.pdf
    U2F800.pdf
    U2FF0.pdf
    U2FF80.pdf
    U3FF80.pdf
    U4DC0.pdf
    U4E00 中文.pdf
    U4FF80.pdf
    U5FF80.pdf
    U6FF80.pdf
    U07C0.pdf
    U7FF80.pdf
    U8FF80.pdf
    U9FF80.pdf
    U10A00.pdf
    U10A0.pdf
    U10FF80.pdf
    U13A0.pdf
    U16A0.pdf
    U19E0.pdf
    U20A0.pdf
    U20D0.pdf
    U25A0.pdf
    U27C0.pdf
    U27F0.pdf
    U30A0 日语片假文.pdf
    U31A0.pdf
    U31C0.pdf
    U31F0.pdf
    U0080 拉丁符号.pdf
    U0100.pdf
    U103A0.pdf
    U0180.pdf
    U0250.pdf
    U0300.pdf
    U0370.pdf
    U0400.pdf
    U0500.pdf
    U0530.pdf
    U0590.pdf
    U0600.pdf
    U0700.pdf
    U0750.pdf
    U0780.pdf
    U0900.pdf
    U0980.pdf
    U1000.pdf
    U1100.pdf
    U1200.pdf
    U1380.pdf
    U1400.pdf
    U1680.pdf
    U1700.pdf
    U1720.pdf
    U1740.pdf
    U1760.pdf
    U1780.pdf
    U1800.pdf
    U1900.pdf
    U1950.pdf
    U1980.pdf
    U2000.pdf
    U2070.pdf
    U2100.pdf
    U2150.pdf
    U2190 箭头.pdf
    U2200 数学符号.pdf
    U2300.pdf
    U2400.pdf
    U2440.pdf
    U2460 数字序号.pdf
    U2500 制表符.pdf
    U2580 方块.pdf
    U2600.pdf
    U2700.pdf
    U2800.pdf
    U2900.pdf
    U2980.pdf
    U3000 中文标点.pdf
    U3040 日语平假文.pdf
    U3100 汉语旧拼音.pdf
    U3130 韩文拼音.pdf
    U3190.pdf
    U3200 数字符号 标志.pdf
    U3300 单位和时间.pdf
    U3400.pdf
    U10000.pdf
    U10080.pdf
    U10100.pdf
    U10140.pdf
    U10300.pdf
    U10330.pdf
    U10380.pdf
    U10400.pdf
    U10450.pdf
    U10480.pdf
    U10800.pdf
    U10900.pdf
    U12000.pdf
    U12400.pdf
    U20000.pdf
    U100000.pdf
    UA000.pdf
    UA490.pdf
    UA700.pdf
    UA720.pdf
    UA800.pdf
    UA840.pdf
    UAC00 韩文.pdf
    UAFF80.pdf
    UBFF80.pdf
    UCFF80.pdf
    UD800.pdf
    UDC00.pdf
    UDFF80.pdf
    UE0000.pdf
    UE000.pdf
    UE0100.pdf
    UEFF80.pdf
    UF0000.pdf
    UF900.pdf
    UFB00.pdf
    UFB50.pdf
    UFE00.pdf
    UFE10 竖排中文标点.pdf
    UFE20.pdf
    UFE50.pdf
    UFE70.pdf
    UFF00 全角.pdf
    UFFF0.pdf
    UFFF80.pdf
      

  6.   

    不好意思,懒得打字,直接把文件名copy了过来
    而且好像没有按顺序排,抱歉
      

  7.   

    兄弟。。这些PDF文件的下载地址。。能告诉我吗?