在一幅图像中,需要识别出来汉字出现的位置,和汉字的内容,寻有这方面经验的高手。

解决方案 »

  1.   

    典型的OCR啦,文本定位和文本识别。文本定位的算法要根据你图像的特点决定;文本识别需要用到中文识别核心了,这个有很多商用开发包,开源的基本不可靠。google的那tesseract可以试试,不过效果好像很一般,他那种识别特征感觉不适用中文识别。
      

  2.   

    to ftai08: 
    我在考虑需要考虑缩放,模型可以是10号字的点阵,具体识别的可能是20号的字,大小需要缩放一下;汉字内容指的是具体是什么汉字;按静态图形处理吧,实际是变化的图像,要处理的那个时间点我想也需要按静态处理。
      

  3.   

    现在干orc的都搞不好。识别率太低
      

  4.   

    发两张图像到我邮箱吧[email protected],看看有没有什么建议。
      

  5.   

    首先应该先判断出图像中是否有汉字,类似于字幕提取;然后再进行OCR
      

  6.   

    http://www.autohotkey.com
    ImageSearch
      

  7.   

    1、颜色。
      “墨者飞狐”是蓝色字体。而“毒寡妇”是黄色字体。注意这点:具有特定的“三原色(红黄绿?)”的 赋值。
    2、空间大小。
      这两个名字的汉字显示,具有固定的长度和宽度。  从这两点,可以定位图形的“名字”在哪里。  OCR是“光学字符阅读”,例如,用扫描仪扫描书籍,变成电子件,文件格式有PDF,BMP等。OCR技术能识别出具体是什么汉字和字母、数字。  第二步,是图形汉字的识别问题。  
      图形汉字、字母、数字的识别方面的研究成果应该很多,相关的论文可以查阅《中国知网》,网址:http://www.cnki.net.
      

  8.   

    我做过一个简单的DEMO, 可以到这个程序, 你看一下怎么样, 然后再讨论原图定位图
      

  9.   

    to zhao4zhong1 33#
    大神你好,对ImageSearch你是否有过研究? 
      

  10.   

    to 40# betolcsd 
    你的demo不错,貌似我要的东西,可以详谈。
      

  11.   

    我先罗嗦一句再说一下大概的方案,   别写挂了, 没有出路, 如果还年轻, 拼一把, 杀回正规做学问这条路.
    我的方案是基于 PC机显示器原理 和 汉字结构 两者的特点设计成的.PC机特点:  raster display.   无论是怎么描述的字形, 最终交到frame buffer里的, 都是 pexel raster 形式.汉字字构特点:  方块字, 不是说一开始就用方块去切割, 而是说无论哪种结构的汉字, 都可以用各种大小的方块组合而成.   一定要注意, 是组合, 不是切割.  一旦你去切割, 一开始是简单, 但是最后碰到各种汉字排版混合排版的时候, 一定是越来越难处理的.   而组合是一开始有点复杂, 但是越来越简单.  在字体已知的情况下, 我的识别率做到了 100% , 无论是多复杂的汉字和排版. 效率非常高,  1440 * 900 满屏识别的情况下, 峰值性能可以到 120次/s, 这个需要其他小组件的支持, 像字库这些.