求批量转换pdf文件为txt文件解决方案 现有几十个pdf文件,需要提取其中的全部文字。如果可以直接读取pdf文件中的文字最好,不好实现的话可以转换为txt文件然后读取也可以。找了好多资料没又发现比较明确的答案,说是用itextsharp什么的,没找到相应方法,郁闷中。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 http://www.adobe.com/products/acrobat/access_onlinetools.html 好多开源的PDF相关类库(for .NET) ..iTextSharphttp://itextsharp.sourceforge.net/Report.NEThttp://report.sourceforge.net/ 不好意思, 没看清题目. 楼主原来是在用iTextSharp, 至于用哪个函数哪个方法.没机会深入研究过. 再帮你顶一下. 我们研究了一下,使用iTextSharp,有了一定进展,但不能比较准确定位 我可以提供这样的控件,有意向请和我联系[email protected] Acrobat.自己写代码实现除非你了解API。 dotnet环境下从PDF文档中抽取Text文本的一些方法汇总 http://www.cnblogs.com/hardrock/archive/2006/04/05/367543.html 如何实现写xmlns="XXX"的xml文件(msdn中没有) DataTable排序 请教高手 GDI+清除多余的线 schema.ini(ODBC Text Driver) 的问题 C#中的读XML结点问题!! 关于ASP。NET的一个奇怪问题 新手提问,C#中怎么调用方法? 在 jscript中怎么写这个正则表达式 (校验手机号码:必须以数字开头,除数字外,可含有“-”) c#初学 c#中如何处理smallmoney??? 在.net中怎么把数据库中的二进制pdf文件用Adobe Reader读出来? Form上的绘图问题
iTextSharp
http://itextsharp.sourceforge.net/Report.NET
http://report.sourceforge.net/
自己写代码实现除非你了解API。
http://www.cnblogs.com/hardrock/archive/2006/04/05/367543.html