这是不可能呢,GB和BIG5有70%的编码是重合的,在混合编码的情况下,不能准确的识别。
但可以更据一些附加条件提高准确率

解决方案 »

  1.   

    我认为也是,但是MAGICWIN的识别能力很高(即使是混合编码),不知道他的算法是如何实现的.
      

  2.   

    算法吗!
    有词组法he常用字法
    是MAGICWIN用的方法
    具体,就是,如果两个编码是一个GB词则是GB,是BIG5.....
    如果都是词,比较,常用性
    不是词,比较字的常用性。还可以加入常用句式的判断,还有一种,
    判断某部分必定是同种编码,然后比较那种编码正确性高