java用OCR怎么才能更好的把图片上的数据读出来。像身份证上的图片还有底纹。在OCR是数据往往会出错。有哪位大神有更好的方法使其准确率更高一点????java用OCR

解决方案 »

  1.   

    orc准确率都是有限的 像你这种专项的做可以专项优化一下这个具体的特征提取就得自己 摸索了 这么转向的东西 估计论坛中也没有人有。
      

  2.   

    如果是身份证,识别上面的文字,最好先做个滤镜处理,把文字颜色接近的颜色留下,其余一律设置成底色。假设文字黑色:二进制 00000000 00000000 00000000 00000000 (0xFF000000)32bit,每8bit分别是alpha R G BAlpha都是FF,可以无视,对于RGB你可以考虑只比较其高5位,那么使用掩码11111111 11111000 11111000 11111000 (0xFFF8F8F8)如果像素的argb & MASK == 0xFF000000 & MASK,则认为是文字,将其设置为0xFF000000,否则设置为背景0xFFFFFFFF然后保存图像,再去OCR
      

  3.   

    有谁给我推介几本关于ocr的书籍啊,在这先谢过了。