private void btnGo_Click(object sender, EventArgs e)
{
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); //应用当前语言包。注,Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list WebClient wc = new WebClient();
byte[] oimg = wc.DownloadData(txtImageUrl.Text); // 自己修改成要识别的地址吧
Bitmap bp = new Bitmap(new MemoryStream(oimg), true);//识别图像
Bitmap bp2 = new Bitmap(new MemoryStream(oimg), true);
picBox1.Image = bp2;
picBox2.Image = bp; List<tessnet2.Word> result = new List<tessnet2.Word>();
string txt = ""; try
{
result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
foreach (tessnet2.Word word in result)//遍历识别结果。
{
txt += word.Text;
}
}
catch (Exception ex)
{ }
wc.close();
bp.dispose();
bp2.dispose();
wc.close();
ocr.dispose(); GC.Collect();
GC.WaitForPendingFinalizers();
GC.Collect();
textBox1.Text = txt;
}
从网上下载了OCR.Tesseract.Demo1,测试时发现,这段代码每次都消耗内存, 重复多次使用后,把内存消耗完了。最主要是下面几步:
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);
特别耗内存。大家有没有好的解决办法?
{
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); //应用当前语言包。注,Tessnet2是支持多国语的。语言包下载链接:http://code.google.com/p/tesseract-ocr/downloads/list WebClient wc = new WebClient();
byte[] oimg = wc.DownloadData(txtImageUrl.Text); // 自己修改成要识别的地址吧
Bitmap bp = new Bitmap(new MemoryStream(oimg), true);//识别图像
Bitmap bp2 = new Bitmap(new MemoryStream(oimg), true);
picBox1.Image = bp2;
picBox2.Image = bp; List<tessnet2.Word> result = new List<tessnet2.Word>();
string txt = ""; try
{
result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
foreach (tessnet2.Word word in result)//遍历识别结果。
{
txt += word.Text;
}
}
catch (Exception ex)
{ }
wc.close();
bp.dispose();
bp2.dispose();
wc.close();
ocr.dispose(); GC.Collect();
GC.WaitForPendingFinalizers();
GC.Collect();
textBox1.Text = txt;
}
从网上下载了OCR.Tesseract.Demo1,测试时发现,这段代码每次都消耗内存, 重复多次使用后,把内存消耗完了。最主要是下面几步:
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);
特别耗内存。大家有没有好的解决办法?
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);
这段代码这里就自动退出了 能否看看我的提问http://topic.csdn.net/u/20120912/15/915bdd64-826e-4c25-b002-53cfecabd04f.html?seed=1608687446&r=79663190#r_79663190
try
{
result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
foreach (tessnet2.Word word in result)//遍历识别结果。
{
txt += word.Text;
}
}
catch (Exception ex)
{ }http://bbs.csdn.net/topics/390277466?page=1#post-392888541
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); ocr 有没有Dispose
有Dispose。但是调用也不去作用