汉字识别的问题 在一幅图像中,需要识别出来汉字出现的位置,和汉字的内容,寻有这方面经验的高手。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 典型的OCR啦,文本定位和文本识别。文本定位的算法要根据你图像的特点决定;文本识别需要用到中文识别核心了,这个有很多商用开发包,开源的基本不可靠。google的那tesseract可以试试,不过效果好像很一般,他那种识别特征感觉不适用中文识别。 to ftai08: 我在考虑需要考虑缩放,模型可以是10号字的点阵,具体识别的可能是20号的字,大小需要缩放一下;汉字内容指的是具体是什么汉字;按静态图形处理吧,实际是变化的图像,要处理的那个时间点我想也需要按静态处理。 现在干orc的都搞不好。识别率太低 发两张图像到我邮箱吧[email protected],看看有没有什么建议。 首先应该先判断出图像中是否有汉字,类似于字幕提取;然后再进行OCR http://www.autohotkey.comImageSearch 1、颜色。 “墨者飞狐”是蓝色字体。而“毒寡妇”是黄色字体。注意这点:具有特定的“三原色(红黄绿?)”的 赋值。2、空间大小。 这两个名字的汉字显示,具有固定的长度和宽度。 从这两点,可以定位图形的“名字”在哪里。 OCR是“光学字符阅读”,例如,用扫描仪扫描书籍,变成电子件,文件格式有PDF,BMP等。OCR技术能识别出具体是什么汉字和字母、数字。 第二步,是图形汉字的识别问题。 图形汉字、字母、数字的识别方面的研究成果应该很多,相关的论文可以查阅《中国知网》,网址:http://www.cnki.net. 我做过一个简单的DEMO, 可以到这个程序, 你看一下怎么样, 然后再讨论原图定位图 to zhao4zhong1 33#大神你好,对ImageSearch你是否有过研究? to 40# betolcsd 你的demo不错,貌似我要的东西,可以详谈。 我先罗嗦一句再说一下大概的方案, 别写挂了, 没有出路, 如果还年轻, 拼一把, 杀回正规做学问这条路.我的方案是基于 PC机显示器原理 和 汉字结构 两者的特点设计成的.PC机特点: raster display. 无论是怎么描述的字形, 最终交到frame buffer里的, 都是 pexel raster 形式.汉字字构特点: 方块字, 不是说一开始就用方块去切割, 而是说无论哪种结构的汉字, 都可以用各种大小的方块组合而成. 一定要注意, 是组合, 不是切割. 一旦你去切割, 一开始是简单, 但是最后碰到各种汉字排版混合排版的时候, 一定是越来越难处理的. 而组合是一开始有点复杂, 但是越来越简单. 在字体已知的情况下, 我的识别率做到了 100% , 无论是多复杂的汉字和排版. 效率非常高, 1440 * 900 满屏识别的情况下, 峰值性能可以到 120次/s, 这个需要其他小组件的支持, 像字库这些. MFC单文档添加一个开机画面 Attach和SubclassWindow的用法? 用createprocess创建cmd的问题 com技术内幕书中附的源码中的组件(dll)是如何编译得到的? 关于何时使用#include 谁有查找图像边缘的代码实例,谢谢 关于用vc++生成word自动化文档的一些问题 命名空间的问题,在线求救。 How can I get a Dialog handle? dos下输入总被关闭,如何输入 如何让我的程序在桌面启动前执行 基于四叉树的LOD网格中视点移动的问题
我在考虑需要考虑缩放,模型可以是10号字的点阵,具体识别的可能是20号的字,大小需要缩放一下;汉字内容指的是具体是什么汉字;按静态图形处理吧,实际是变化的图像,要处理的那个时间点我想也需要按静态处理。
ImageSearch
“墨者飞狐”是蓝色字体。而“毒寡妇”是黄色字体。注意这点:具有特定的“三原色(红黄绿?)”的 赋值。
2、空间大小。
这两个名字的汉字显示,具有固定的长度和宽度。 从这两点,可以定位图形的“名字”在哪里。 OCR是“光学字符阅读”,例如,用扫描仪扫描书籍,变成电子件,文件格式有PDF,BMP等。OCR技术能识别出具体是什么汉字和字母、数字。 第二步,是图形汉字的识别问题。
图形汉字、字母、数字的识别方面的研究成果应该很多,相关的论文可以查阅《中国知网》,网址:http://www.cnki.net.
大神你好,对ImageSearch你是否有过研究?
你的demo不错,貌似我要的东西,可以详谈。
我的方案是基于 PC机显示器原理 和 汉字结构 两者的特点设计成的.PC机特点: raster display. 无论是怎么描述的字形, 最终交到frame buffer里的, 都是 pexel raster 形式.汉字字构特点: 方块字, 不是说一开始就用方块去切割, 而是说无论哪种结构的汉字, 都可以用各种大小的方块组合而成. 一定要注意, 是组合, 不是切割. 一旦你去切割, 一开始是简单, 但是最后碰到各种汉字排版混合排版的时候, 一定是越来越难处理的. 而组合是一开始有点复杂, 但是越来越简单. 在字体已知的情况下, 我的识别率做到了 100% , 无论是多复杂的汉字和排版. 效率非常高, 1440 * 900 满屏识别的情况下, 峰值性能可以到 120次/s, 这个需要其他小组件的支持, 像字库这些.