要求提取出来的文本内容和标点符号均正确,分页有规律(方便程序处理)。
方法不限,但要求能够方便地处理大批量处理PDF文件。
PDF样本文件下载:
ftp://211.161.13.249
用户名:abc
密码:123
下载时间:星期1至星期5晚上6:30-11:30
周末上午11:00-晚11:30成功后,请将文本及联系方式发至:[email protected]。
我会立即与您联系并支付现金。
方法不限,但要求能够方便地处理大批量处理PDF文件。
PDF样本文件下载:
ftp://211.161.13.249
用户名:abc
密码:123
下载时间:星期1至星期5晚上6:30-11:30
周末上午11:00-晚11:30成功后,请将文本及联系方式发至:[email protected]。
我会立即与您联系并支付现金。
1)如果pdf原是文字的,那很可以选取后CTRL+C,CTRL+V,当然,前题是没有锁定这些操作。
2)打印,当然也是没有锁定打印操作。