private void btnGo_Click(object sender, EventArgs e)
        {
            tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
            string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
            if (!string.IsNullOrEmpty(txtCharList.Text))
            {
                defaultCharList = txtCharList.Text;
            }
            ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
            ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); //应用当前语言包。注,Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list            WebClient wc = new WebClient();
            byte[] oimg = wc.DownloadData(txtImageUrl.Text); // 自己修改成要识别的地址吧
            Bitmap bp = new Bitmap(new MemoryStream(oimg), true);//识别图像
            Bitmap bp2 = new Bitmap(new MemoryStream(oimg), true);
            picBox1.Image = bp2;
 
            picBox2.Image = bp;            List<tessnet2.Word> result = new List<tessnet2.Word>();
            string txt = "";            try
            {
                result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
                foreach (tessnet2.Word word in result)//遍历识别结果。
                {
                    txt += word.Text;
                }
            }
            catch (Exception ex)
            {            }
 wc.close();
bp.dispose();
bp2.dispose();
wc.close();
ocr.dispose();  GC.Collect();
            GC.WaitForPendingFinalizers();
  GC.Collect();
            textBox1.Text = txt;
        }
           
从网上下载了OCR.Tesseract.Demo1,测试时发现,这段代码每次都消耗内存, 重复多次使用后,把内存消耗完了。最主要是下面几步:
 tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
            string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
            if (!string.IsNullOrEmpty(txtCharList.Text))
            {
                defaultCharList = txtCharList.Text;
            }
            ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
            ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); 
特别耗内存。大家有没有好的解决办法?

解决方案 »

  1.   

    上面这段代如果放在while中反复执行,会把内存消耗完。
      

  2.   

    ocr做成静态或全部变量,这样就不需要每次都Init了
      

  3.   

    可以试试,每次做init的时候都比较消耗内存
      

  4.   

    为什么我这里  每次执行到初始化的  
    ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);  
    这段代码这里就自动退出了   能否看看我的提问http://topic.csdn.net/u/20120912/15/915bdd64-826e-4c25-b002-53cfecabd04f.html?seed=1608687446&r=79663190#r_79663190
      

  5.   

    lz解决了没啊。我也遇到一样的问题。推测是这段代码的问题:
      try
                    {
                        result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
                        foreach (tessnet2.Word word in result)//遍历识别结果。
                        {
                            txt += word.Text;
                        }
                    }
                    catch (Exception ex)
                    {                }http://bbs.csdn.net/topics/390277466?page=1#post-392888541
      

  6.   

    tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
                string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
                if (!string.IsNullOrEmpty(txtCharList.Text))
                {
                    defaultCharList = txtCharList.Text;
                }
                ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
                ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); ocr 有没有Dispose
      

  7.   

    这是我写的tessnet3的demo 研究了两个星期.. http://download.csdn.net/detail/chen644733521/4662406
      

  8.   


    有Dispose。但是调用也不去作用