汉字识别的问题

在一幅图像中，需要识别出来汉字出现的位置，和汉字的内容，寻有这方面经验的高手。

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

典型的OCR啦，文本定位和文本识别。文本定位的算法要根据你图像的特点决定；文本识别需要用到中文识别核心了，这个有很多商用开发包，开源的基本不可靠。google的那tesseract可以试试，不过效果好像很一般，他那种识别特征感觉不适用中文识别。
to ftai08:
我在考虑需要考虑缩放，模型可以是10号字的点阵，具体识别的可能是20号的字，大小需要缩放一下；汉字内容指的是具体是什么汉字；按静态图形处理吧，实际是变化的图像，要处理的那个时间点我想也需要按静态处理。
现在干orc的都搞不好。识别率太低
发两张图像到我邮箱吧[email protected]，看看有没有什么建议。
首先应该先判断出图像中是否有汉字，类似于字幕提取；然后再进行OCR
http://www.autohotkey.com
ImageSearch
１、颜色。
　　“墨者飞狐”是蓝色字体。而“毒寡妇”是黄色字体。注意这点：具有特定的“三原色（红黄绿？）”的　赋值。
２、空间大小。
　　这两个名字的汉字显示，具有固定的长度和宽度。　　从这两点，可以定位图形的“名字”在哪里。　　ＯＣＲ是“光学字符阅读”，例如，用扫描仪扫描书籍，变成电子件，文件格式有ＰＤＦ，ＢＭＰ等。ＯＣＲ技术能识别出具体是什么汉字和字母、数字。　　第二步，是图形汉字的识别问题。　　
　　图形汉字、字母、数字的识别方面的研究成果应该很多，相关的论文可以查阅《中国知网》，网址：http://www.cnki.net.
我做过一个简单的DEMO, 可以到这个程序, 你看一下怎么样, 然后再讨论原图定位图
to zhao4zhong1 33#
大神你好，对ImageSearch你是否有过研究？
to 40# betolcsd
你的demo不错，貌似我要的东西，可以详谈。
我先罗嗦一句再说一下大概的方案,   别写挂了, 没有出路, 如果还年轻, 拼一把, 杀回正规做学问这条路.
我的方案是基于 PC机显示器原理和汉字结构两者的特点设计成的.PC机特点:  raster display.   无论是怎么描述的字形, 最终交到frame buffer里的, 都是 pexel raster 形式.汉字字构特点:  方块字, 不是说一开始就用方块去切割, 而是说无论哪种结构的汉字, 都可以用各种大小的方块组合而成.   一定要注意, 是组合, 不是切割.  一旦你去切割, 一开始是简单, 但是最后碰到各种汉字排版混合排版的时候, 一定是越来越难处理的.   而组合是一开始有点复杂, 但是越来越简单.  在字体已知的情况下, 我的识别率做到了 100% , 无论是多复杂的汉字和排版. 效率非常高,  1440 * 900 满屏识别的情况下, 峰值性能可以到 120次/s, 这个需要其他小组件的支持, 像字库这些.