使用微软speech5.1进行简单语音识别,识别十个数字即可,个数多的我可以用数字组合实现。
现在参考例子做的识别是把语音识别成发音,一个字识别出几个音,现在搞不清楚怎么还原成一个字,其实条件很简单,我录十个字发音,然后识别端也有这十个字的语音库,我觉得技术上或许是语音识别里难度较低的了。
有没有大侠做过的望请不吝赐教。