不知道海量文本是如何输入的,就像金山词霸的词库那样,几十万的词汇,成百万上千万的字符我想不可能是用键盘手动输入的吧?目前小弟想把一本辞典录成普通文本文件,好像听说过什么尚书识别系统能够进行类似的工作,哪位兄台用过的请多多赐教,不知识别效果如何?谢谢!

解决方案 »

  1.   

    你的意思是Crack别人的?那第一个吃螃蟹的人不可能用的是手动输入吧?
      

  2.   

    我估计最初的都是手动录入
    但不是金山做的,金山买回来的
    因为印刷都是电子排版的,当然有电子文档了,你给钱当然会卖给你了
    OCR是不可能这么大量处理的:)http://lysoft.7u7.net
      

  3.   

    呵呵,我是在别的论坛上请教Nicrosoft,不知道他老人家在不在线...我本来是打算花几千块雇个打工妹来搞定,而且最后还要逐一审核。但突然看到这个,就想走走捷径:http://www.russky.net/down/list.asp?id=296
      

  4.   

    看了刘洋兄熟悉OCR了,能介绍一下OCR的工作原理吗?为什么不能大量处理?
      

  5.   

    ABBYY FineReader 7.0专业版是最新、最准确的ABBYY OCR软件版本。它可以为用户提供最高级别识字精确率,是一个非常节省时间的好方案。FineReader允许你将各种纸张和电子文件转换、编辑以及重新使用,包括:杂志、报纸、传真、复制和PDF文件。注意:这是一个非常大的文件(55MB),需要费些时间下载。