急求:有人实现过纯文本抽取功能吗?? 请教:实现一个功能,即将.doc/.pdf格式的文本转换为.txt格式,重要的是对于.doc/.pdf中嵌入的对象,如visio图表也能正确解析出来。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 属于图象识别技术 这个若是个人来做....很难我记得比较好的一款图象识别成文字的软件(我用过的)有个叫 <尚书7号>的扫描识别软件但要求扫描的时候字体必须放正 否则也识别不好! [属于图象识别技术 这个若是个人来做....很难 我记得比较好的一款图象识别成文字的软件(我用过的)有个叫 <尚书7号> 的扫描识别软件 但要求扫描的时候字体必须放正 否则也识别不好! ]有源代码吗?? PDF格式转换为TXT文本格式 http://www.80diy.com/home/20051122/16/4410908.html doc格式的文本转换为.txt格式:http://topic.csdn.net/u/20071130/22/9ed60eeb-27c0-43d0-a4c3-2980b38f1479.html 红樱枫软件可以,它提供API接口和通用库,不过得购买 楼主还是放弃吧,工程量颇大。无论DOC还是PDF都不是什么好啃的骨头。 有点恶心 使用聚合函数问题 jinjazz(近身剪(N-P攻略))来接分 [100分全部送]老鸟的大困惑 奇怪,不知道你们的VB6是不是这样的! vb的控件数组是不是有bug? 怎样让Ado执行这样一条SQL语句 我发现了:关于vb中picturebox控件的最大漏洞。 VB内部函数不能用是什么原因(如str(),trim()chr()这些函数都不能用)急!!! 使用webbrowser,如何捕获网页上超链接的点击事件,执行自己的代码? 相同配置两台电脑.只有一台可以连接服务器,请高手帮忙@@!~~~ VB实现马赛克
http://topic.csdn.net/u/20071130/22/9ed60eeb-27c0-43d0-a4c3-2980b38f1479.html
无论DOC还是PDF都不是什么好啃的骨头。