数据库, 编码均使用UTF-8
客户可能输入简体内容,也可能输入繁体内容要求检索时,不论输入简体或是繁体,数据库中对应的记录都可以查出比如 用户检索“头发” 那么不仅简体的“头发”要查出来 繁体的“頭髮”也能出来。
同样 用户检索“頭髮” 那么不仅简体的“头发”要查出来 繁体的“頭髮”也能出来。思路 :
用户输入条件后,后台转换接口将查询条件 变成两个,一个简体条件和一个繁体条件,此时进行查询,结果包含简繁体都有。请教:
1.这种思路是否可行~
2.服务器 为solaris 请推荐一个控件完成以下功能:
输入:一个词(不论简体还是繁体)
输出:两个对应的词(一个简体,一个繁体)
或者
输入:一个词(不论简体还是繁体)
输出:一个词(和输入体不同编码,如输入简体,输入繁体)要求该控件可以再SOLARIS下运行~~ 可以考虑购买~
客户可能输入简体内容,也可能输入繁体内容要求检索时,不论输入简体或是繁体,数据库中对应的记录都可以查出比如 用户检索“头发” 那么不仅简体的“头发”要查出来 繁体的“頭髮”也能出来。
同样 用户检索“頭髮” 那么不仅简体的“头发”要查出来 繁体的“頭髮”也能出来。思路 :
用户输入条件后,后台转换接口将查询条件 变成两个,一个简体条件和一个繁体条件,此时进行查询,结果包含简繁体都有。请教:
1.这种思路是否可行~
2.服务器 为solaris 请推荐一个控件完成以下功能:
输入:一个词(不论简体还是繁体)
输出:两个对应的词(一个简体,一个繁体)
或者
输入:一个词(不论简体还是繁体)
输出:一个词(和输入体不同编码,如输入简体,输入繁体)要求该控件可以再SOLARIS下运行~~ 可以考虑购买~
解决方案 »
- 疯狂赠分,砸锅卖铁的赠分之四
- MyEclipse打包部署问题
- 哪位讲讲<html:frame/>各数的用法????
- 请问怎么用程序取txt文件中的带标记的段落
- 我对数据库的添加记录操作老是出问题,请哪位大侠帮帮忙,代码如下:
- 一个关于jsp数据库操作的问题!!急急!!!!!!
- ^_^一个能让大家受益的问题……
- <%include file=filename%>,其中,filename是一个String类型变量,这样不行,怎么实现:(
- 范围为application的bean为一个class,怎样用参数初始化其构造函数呢?
- 阿里云 Java环境 每小时在根目录下生成 hs_err_pid*.log ,求教!
- 菜鸟级问题。。帮帮忙。。。
- 如何导入package?
http://www.knowsky.com/3213.html
这里是用javascript实现的,你可以把里边代码改成java实现就可以了,不是很麻烦的.
先定义两个数组,然后按照相应的位置读取相应的简体繁体汉字就可以了.
那两段string太长了,不让发,我只取了前一段,你去那个网站把它们补全就可以了.package com.demo;package com..demo;
public class TranCodeTest {
private static String simStr = "啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊澳芭捌扒叭吧笆八疤巴拔跋靶把耙坝霸罢爸白柏百"
+ "摆佰败拜稗斑班搬扳般颁板版扮拌伴瓣半办绊邦帮梆榜膀绑棒磅蚌镑傍谤苞胞包褒剥薄雹保堡饱宝抱报暴豹鲍爆杯碑悲卑北辈背贝钡倍狈备惫焙被奔苯"
; private static String comStr = "啊阿埃挨哎唉哀皚癌藹矮艾礙愛隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翺襖傲奧懊澳芭捌扒叭吧笆八疤巴拔跋靶把耙壩霸罷爸白柏百"
+ "擺佰敗拜稗斑班搬扳般頒板版扮拌伴瓣半辦絆邦幫梆榜膀綁棒磅蚌鎊傍謗苞胞包褒剝薄雹保堡飽寶抱報暴豹鮑爆杯碑悲卑北輩背貝鋇倍狽備憊焙被奔苯"
;
public static void main(String[] args) {
String word="摆";
String[] allword=transWord(word);
System.out.println(allword[0]+allword[1]); }
public static String[] transWord(String word){
int index=simStr.indexOf(word);
if(index<0){
index=comStr.indexOf(word);
}
String[] result=new String[2];
result[0]=String.valueOf(simStr.charAt(index));
result[1]=String.valueOf(comStr.charAt(index));
return result;
}
}
1字符码表一对一映射。 例如发->發、干->幹等。但是简繁转换并不是简单的一对一关系,如干在不同上下文,可以分别对应:乾 干 榦,因此该转换不十分准确。这也是大部分简繁转换软件所能达到的级别
2. 对于一对多单字,根据词语识别进行转换。例如:头发->頭髮、出发->出發等。例中的髮和發在简体中都是发,但在繁体中却不一样,这样的情况很多,如干、里、秋等。
3. 对词语表达方式差异的转换。简繁体有不同的表达方式,例如:字节->位元組、光盘->光碟、信息->資訊等。这些表达方式如果不处理,不易理解,尤其是港台不太习惯大陆的表达方式。
4. 根据上下文的词汇翻译。例如:在中国大陆的语言习惯中,"文件"可以是通常意义上的"文件",也可以是计算机中存取的"文件"(document)。但是,在繁体语言习惯中,这两个东西就是分别用"文件"和"档案"两个词来表达。该转换极难做到,而且速度很慢。
我希望能做到大多数的3级转换~~
并且 我的页面代码 是 UNI