C#怎么读取pdf的内容
itextsharp 中有一个pdfReader 好像能读 不过具体不知道怎么实现,找不到read()方法,有谁会吗

解决方案 »

  1.   

    得知道PDF文件结构.......
    二进制读取有用的块,,,,,,,
      

  2.   

    pdf里全是英语文档,图片都没有
      

  3.   

    private static string parseUsingPDFBox(string input)
    {
    PDDocument doc = PDDocument.load(input);
    PDFTextStripper stripper = new PDFTextStripper();
    return stripper.getText(doc);
    } protected void Button1_Click(object sender, System.EventArgs e)
    {
    string text = parseUsingPDFBox(this.File1.PostedFile.FileName);
    this.showtext.InnerText = text; }
      

  4.   

    建议lz到codeproject上去找一些开源的源码。绝对可以找到相应的itextsharp的例子。
      

  5.   

      private static string parseUsingPDFBox(string input)
            {
                PDDocument doc = PDDocument.load(input);
                PDFTextStripper stripper = new PDFTextStripper();
                return stripper.getText(doc);
            }        protected void Button1_Click(object sender, System.EventArgs e)
            {
                string text = parseUsingPDFBox(this.File1.PostedFile.FileName);
                this.showtext.InnerText = text;        }