日文与中文有很多汉字是一样的,在一个文档里夹杂中文和日文,那么如何识别这些相同的字符是中文还是日文?
用java的native2ascii转化,这些相同的汉字unicode是一样的。有工具或者编程想法都行。

解决方案 »

  1.   

    不能,比如“日”字,unicode就是1个,所有称作为CJK(chinese japanese korean)或者CJKV(vietnamese)就好象所有汉语方言,“中国”的“中”字都是一样的,请问,如何区分到底是北京话、上海话、东北话、山西话、陕西话、四川话、广东话还是闽南话?
      

  2.   

    转他么的头,不给转,是日语,就pass,哈哈。
      

  3.   

    无法识别,unicode编码相同,这是unicode一个缺陷。