如题,主要是中文方面的,词应当如何划分,比如:
“程序员天天对着电脑,应该多补充维生素”
对这一句,应当怎么进行词组划分,谢谢
“程序员天天对着电脑,应该多补充维生素”
对这一句,应当怎么进行词组划分,谢谢
解决方案 »
- 如何支持 TShellListView 里的文件可以拖放到其它应用程序中?
- 请问用dbgrid控件如何能实现可以在当前数据行进行编辑,而按回车键或者下箭头不会新增加记录
- 如何实现硬字库串口打印图形!急需!在线等……
- 关于delphi使用adoquery控件执行数据库查询的困惑,求救!!
- combobox简单问题!!
- Delphi 7中为什么没有了Team Source工具?在哪有?
- 同一个系统可不可以装不同版本的DELPHI??
- quicekrep 加载QRP文件
- 在程序中如何调用AC'97声卡的升降调功能?
- 一实数个数组怎样用统计表现出来
- 功能简单的数据库软件编写竟然如此烦琐。晕了。高手救命啊!
- 如何使按钮上的文字颜色改变?(在线等)
Eastunfail(浴血雏龙)==(恶鱼杀手) 你所提的最大公共串好象不太可行,比如:“中国软件”,这个方式,那么“中国软件”肯定是一个词,而“软件”就无法分离出来!!
例如词典:........
软的
软件
软禁
.........
........
演出
中国
中间
......首先比较从第一个字符开始长度为1的UNICODE字符“中”,没有找到相匹配的,在找长度为2的“中国”,找到了,找长度为3的“中国软”,没有找到,回溯,将“中国”输出,并从缓冲区中删除“中国”,然后重复以上步骤找到“软件”。ok~~~~~~~~~
对于算法效率,主要是回溯的时机无法控制,比如一个词一直无法打到,那么是不是在找了二十多个字以后再回溯?!
还有就是词的准确性:比如:“中华人民共和国”这个词,由于有“中华”(我不太确认),那么“中华人民共和国”肯定就无法找到啦!!