如何用StringTokenizer类将一个汉语句子每个词切分? 分词技术主要依赖于数据库支持,靠一个类是不可能的 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 分词技术主要依赖于数据库支持,靠一个类是不可能的 如果分析一个英文句子是不就简单多了,string类足以?另外数据库支持是指。。? --摘计算机分词单位主要依据国家标准《分词规范》来确定,但《分词规范》仅仅提出一套标准的分词规则,并明确了一些原则性问题,为便于操作,仍需根据《分词规范》制订出一个实例化的词表,作为《分词规范》的细化和补充;《分词规范》较多采用定性和举例方法进行描述,客观上造成相当多的分词单位难以确定,从而影响了《分词规范》的可操作性,造成不同的分词系统的分词结果难以一致,因此需要研制一个与领域无关的通用或常用词词表,使《分词规范》用词表形式具体化;对于信息界而言,只有《分词词表》才能真正实现汉语词表语料库等主要资源的共享和复用,避免了重复开发所造成的浪费。对于语言学界来说,《分词词表》可以促进汉语研究、汉语教学和词典编辑出版以及大规模真实语料加工处理。 大家帮我看看这个是什么错误 java数据类型转换的问题 如何获得父组件? gui 乱码 JNI调用dll问题 获取光标位置?? 怎么在java里给数据库插入一条新记录然后立刻取出此条记录的id(sqlserver).而不会取到几乎同时插入的别人的记录id 谁有ultraEdit的注册机? 网络大协作:用java开发机器人站点,欢迎有志者加盟。。。。 数组作为参数传给函数运行时报错 [问题]要分的请进,答对必给!! 请问哪位能推荐几种好的反编译软件,在哪里可以下载
计算机分词单位主要依据国家标准《分词规范》来确定,但《分词规范》仅仅提出一套标准的分词规则,并明确了一些原则性问题,为便于操作,仍需根据《分词规范》制订出一个实例化的词表,作为《分词规范》的细化和补充;
《分词规范》较多采用定性和举例方法进行描述,客观上造成相当多的分词单位难以确定,从而影响了《分词规范》的可操作性,造成不同的分词系统的分词结果难以一致,因此需要研制一个与领域无关的通用或常用词词表,使《分词规范》用词表形式具体化;
对于信息界而言,只有《分词词表》才能真正实现汉语词表语料库等主要资源的共享和复用,避免了重复开发所造成的浪费。对于语言学界来说,《分词词表》可以促进汉语研究、汉语教学和词典编辑出版以及大规模真实语料加工处理。