function GetPYIndexChar(strChinese: string;bUpCase: Boolean = True): char; begin // 根据汉字表中拼音首字符分别为“A”至“Z”的汉字内码范围, // 要检索的汉字只需要检查它的内码位于哪一个首字符的范围内, // 就可以判断出它的拼音首字符。 case WORD(strChinese[1]) shl 8 + WORD(strChinese[2]) of $B0A1..$B0C4 : result := 'A'; $B0C5..$B2C0 : result := 'B'; $B2C1..$B4ED : result := 'C'; $B4EE..$B6E9 : result := 'D'; $B6EA..$B7A1 : result := 'E'; $B7A2..$B8C0 : result := 'F'; $B8C1..$B9FD : result := 'G'; $B9FE..$BBF6 : result := 'H'; $BBF7..$BFA5 : result := 'J'; $BFA6..$C0AB : result := 'K'; $C0AC..$C2E7 : result := 'L'; $C2E8..$C4C2 : result := 'M'; $C4C3..$C5B5 : result := 'N'; $C5B6..$C5BD : result := 'O'; $C5BE..$C6D9 : result := 'P'; $C6DA..$C8BA : result := 'Q'; $C8BB..$C8F5 : result := 'R'; $C8F6..$CBF9 : result := 'S'; $CBFA..$CDD9 : result := 'T'; $CDDA..$CEF3 : result := 'W'; $CEF4..$D188 : result := 'X'; $D1B9..$D4D0 : result := 'Y'; $D4D1..$D7F9 : result := 'Z'; else result := char(0); end; if not bUpCase then begin // 转换为小写 result := Chr(Ord(result)+32); end; end;function GetPYIndexStr(strChinese: string;bUpCase: Boolean = True): string; var strChineseTemp : string; cTemp : Char; begin result := ''; strChineseTemp := strChinese; while strChineseTemp<>'' do begin cTemp := GetPYIndexChar(strChineseTemp); if not bUpCase then begin // 转换为小写 cTemp := Chr(Ord(cTemp)+32); end; result := result + string(cTemp); strChineseTemp := Copy(strChineseTemp,3,Length(strChineseTemp)); end; end;
所以你直需要找到每个声母的第一个汉字的
值就可以了,比如a 第一个是汉字是阿,
b第一个汉字是巴,巴>爱>阿,则爱的声母为a
在GB2312编码你可试过二级汉字?更不用说GBK了。
begin
// 根据汉字表中拼音首字符分别为“A”至“Z”的汉字内码范围,
// 要检索的汉字只需要检查它的内码位于哪一个首字符的范围内,
// 就可以判断出它的拼音首字符。
case WORD(strChinese[1]) shl 8 + WORD(strChinese[2]) of
$B0A1..$B0C4 : result := 'A';
$B0C5..$B2C0 : result := 'B';
$B2C1..$B4ED : result := 'C';
$B4EE..$B6E9 : result := 'D';
$B6EA..$B7A1 : result := 'E';
$B7A2..$B8C0 : result := 'F';
$B8C1..$B9FD : result := 'G';
$B9FE..$BBF6 : result := 'H';
$BBF7..$BFA5 : result := 'J';
$BFA6..$C0AB : result := 'K';
$C0AC..$C2E7 : result := 'L';
$C2E8..$C4C2 : result := 'M';
$C4C3..$C5B5 : result := 'N';
$C5B6..$C5BD : result := 'O';
$C5BE..$C6D9 : result := 'P';
$C6DA..$C8BA : result := 'Q';
$C8BB..$C8F5 : result := 'R';
$C8F6..$CBF9 : result := 'S';
$CBFA..$CDD9 : result := 'T';
$CDDA..$CEF3 : result := 'W';
$CEF4..$D188 : result := 'X';
$D1B9..$D4D0 : result := 'Y';
$D4D1..$D7F9 : result := 'Z';
else
result := char(0);
end;
if not bUpCase then
begin // 转换为小写
result := Chr(Ord(result)+32);
end;
end;function GetPYIndexStr(strChinese: string;bUpCase: Boolean = True): string;
var
strChineseTemp : string;
cTemp : Char;
begin
result := '';
strChineseTemp := strChinese;
while strChineseTemp<>'' do
begin
cTemp := GetPYIndexChar(strChineseTemp);
if not bUpCase then
begin // 转换为小写
cTemp := Chr(Ord(cTemp)+32);
end;
result := result + string(cTemp);
strChineseTemp := Copy(strChineseTemp,3,Length(strChineseTemp));
end;
end;
我这里有库文件,如果你想要,告诉我邮件地址,
我email给你.
[email protected] 其实实现这个功能的代码 我有 俩份,都是网友给我的
如果需要,我下次来把另外一份贴到这里另外,eaglet(小鹰),你的方法好象对于多音 字的识别上存在一定的问题谢谢 各位
可以给我一份吗?[email protected] 谢谢