用office自带的ocr运行不起来, 当用到.OCR miLANG_CHINESE_SIMPLIFIED就会报异常了, 不知道各位有没这方面的经验.如果有其它更好的OCR方面的控件或DLL,可不可以透露一下,谢谢

解决方案 »

  1.   

    没这方面的经验.
    ADOBE公司应该有这方面的产品
      

  2.   

    转一点东西来,顺便学习学习1、没有安装OFFICE 2003的安装一下_注意_一定要把Document Imaging勾上
    2、把C:\Windows\system32\regsvr32.exe复制到C:\Program Files\Common Files\Microsoft Shared\MODI\11.0中_把里面所有DLL都拖到regsvr32.exe上注册下
    3、本人建一张有文字的图片_便于测试_本人这里直接在Fireworks里打了四个字_并保存到f:\1.tif
    4、打开VB建一工程_点击菜单中的"工程"->"引用"_找到Microsoft Office Document Imaging 11.0 Type Library_勾选添加
    4、拖一个按钮到窗口上_双击按钮并输入代码:
    Private Sub Command1_Click()Dim miDoc As MODI.Document
    Dim miWord As MODI.Word
    Dim strWordInfo As StringSet miDoc = New MODI.Document
    miDoc.Create "f:\1.tif"miDoc.Images(0).OCR miLANG_CHINESE_SIMPLIFIED, True, TrueSet miWord = miDoc.Images(0).Layout.Words(2)
    MsgBox miWord.Text, vbInformation + vbOKOnly, _
    "Word Information"Set miWord = Nothing
    Set miDoc = Nothing
    End Sub假如操作无误_您应该能够看到结果了
      

  3.   

    引用C:\Program Files\Common Files\Microsoft Shared\MODI\11.0\MDIVWCTL.DLLPrivate Sub Command1_Click()
    Dim strLayoutInfo As String
    Dim miDoc As Object
    Dim modiLayout As Object     '初始化并加载文档
        Set miDoc = CreateObject("MODI.Document")            '创建对象
        miDoc.Create "z.tif"               '加载图片文件    Screen.MousePointer = vbHourglass                    '设置光标忙
        '识别
        miDoc.Images(0).OCR miLANG_CHINESE_SIMPLIFIED, True, True '有用的就此一句,识别为中文简体    Set modiLayout = miDoc.Images(0).Layout              '读出数据
        strLayoutInfo = _
            "Language: " & modiLayout.Language & vbCrLf & _
            "Number of characters: " & modiLayout.NumChars & vbCrLf & _
            "Number of fonts: " & modiLayout.NumFonts & vbCrLf & _
            "Number of words: " & modiLayout.NumWords & vbCrLf & _
            "Beginning of text: " & Left(modiLayout.Text, 50) & vbCrLf & _
            "First word of text: " & modiLayout.Words(0).Text
        MsgBox strLayoutInfo, vbInformation + vbOKOnly, "Layout Information"
        Set modiLayout = Nothing
        Set miDoc = Nothing
        Screen.MousePointer = vbDefault
    End Sub
      

  4.   

    必须是OFFICE 2003版的,请确定你的版本
      

  5.   

    现成的没用过,我都是自己开发的。
    但是还是用过一些OCR方面的软件,只是感觉识别率不是很理想。
      

  6.   

    lz潜水好久。微软的OCR是买的清华紫光的
      

  7.   

    终于找到问题了, office 的OCR是一定要用二值化的图片来识别的, 如果是其它的有颜色的图就报些乱七八糟的错误来误导人, 比如会报 ocr running error,  ep_dcom_ocr等. 希望大家以后不走弯路,避免这个问题, 我就是自己随便弄了一张图来害自己了.
      

  8.   

    http://www.pudn.com/downloads267/sourcecode/windows/detail1222716.html
    看看这个有用吗
      

  9.   

    我以前在Win2000下安装了CHSOCR.msi后用二值化tif图识别是可以的。
    刚才在Win2003下重新安装了CHSOCR.msi后在.Create时报错。
      

  10.   

    刚搞定了。
    关键是安装或更新的时候“_注意_一定要把Document Imaging勾上!!!!!!!!!有木有!!!!!!!!!!”