疑难问题:怎么得到纯文本?
"; mso-ansi-language:#0400; mso-fareast-language:#0400; mso-bidi-language:#0400;} 
类似这样的,怎么去掉呢?

解决方案 »

  1.   

    看看fckeditor js源文件中的某cleanword方法
    里面的正则包含这个了
      

  2.   

    这个格式应该是word的格式,郁闷!我是用ewebeditor导入word的。
      

  3.   


    public static void main(String[] args) throws Exception {
    Pattern p = Pattern.compile("(;|(mso-(ansi|fareast|bidi)-language:#0400)|})");
    String[] result = p
    .split("哈哈; mso-ansi-language:#0400; mso-fareast-language:#0400; mso-bidi-language:#0400;}呵呵");
    for (int i = 0; i < result.length; i++)
    System.out.println(result[i]);
    }