微软提供了一个处理中日韩文字的dot net 类库,可以取拼音,还包括音调,叫什么记不得了 明天到单位帮你查一下
下载网址 http://www.microsoft.com/downloads/details.aspx?displaylang=zh-cn&FamilyID=f9cfc884-1f00-45fa-b2fb-303d9e110bc7 下面是介绍 概述 Visual Studio International Pack 包含一组类库,该类库扩展了.NET Framework对全球化软件开发的支持。使用该类库提供的类,.NET 开发人员可以更方便的创建支持多文化多语言的软件应用。该软件包1.0版提供下面七个组件以增强.NET Framework对全球化软件应用开发的支持。 * East Asia Numeric Formatting Library - 支持将小写的数字字符串格式化成简体中文,繁体中文,日文和韩文的大写数字字符串。 * Japanese Kana Conversion Library - 支持将日文假名(Kana)转化为另一种日文字符。 * Japanese Text Alignment Library - 支持日文特有的一种对齐格式。 * Japanese Yomi Auto-Completion Library - 类库支持感知日文输入法的输入自动完成和一个文本框控制的示例。 * Korean Auto Complete TextBox Control - 在文本框中支持韩文输入法的智能感知和输入自动完成。 * Simplified Chinese Pin-Yin Conversion Library - 支持获取简体中文字符的常用属性比如拼音,多音字,同音字,笔画数。 * Traditional Chinese to Simplified Chinese Conversion Library and Add-In Tool - 支持简繁体中文之间的转换. 该组件还包含一个Visual Studio集成开发环境中的插件(Add-in)支持简繁体中文资源文件之间的转换。
明天到单位帮你查一下
http://www.microsoft.com/downloads/details.aspx?displaylang=zh-cn&FamilyID=f9cfc884-1f00-45fa-b2fb-303d9e110bc7
下面是介绍
概述
Visual Studio International Pack 包含一组类库,该类库扩展了.NET Framework对全球化软件开发的支持。使用该类库提供的类,.NET 开发人员可以更方便的创建支持多文化多语言的软件应用。该软件包1.0版提供下面七个组件以增强.NET Framework对全球化软件应用开发的支持。 * East Asia Numeric Formatting Library - 支持将小写的数字字符串格式化成简体中文,繁体中文,日文和韩文的大写数字字符串。
* Japanese Kana Conversion Library - 支持将日文假名(Kana)转化为另一种日文字符。
* Japanese Text Alignment Library - 支持日文特有的一种对齐格式。
* Japanese Yomi Auto-Completion Library - 类库支持感知日文输入法的输入自动完成和一个文本框控制的示例。
* Korean Auto Complete TextBox Control - 在文本框中支持韩文输入法的智能感知和输入自动完成。
* Simplified Chinese Pin-Yin Conversion Library - 支持获取简体中文字符的常用属性比如拼音,多音字,同音字,笔画数。
* Traditional Chinese to Simplified Chinese Conversion Library and Add-In Tool - 支持简繁体中文之间的转换. 该组件还包含一个Visual Studio集成开发环境中的插件(Add-in)支持简繁体中文资源文件之间的转换。
{
if (SourceString == null)
return null;
Encoding ed = Encoding.GetEncoding("GB2312");
if (ed == null)
throw (new ArgumentException("没有找到编码集GB2312"));
int bh = 0;
char[] charary = SourceString.ToCharArray();
byte[] bAry = new byte[2];
StringBuilder rtnSb = new StringBuilder();
for (int i = 0; i < charary.Length; i++)
{
bAry = ed.GetBytes(charary[i].ToString());
if (bAry.Length == 1)
{
rtnSb.Append(charary[i]);
continue;
}
bh = bAry[0] - 0xA0;
if (0x10 <= bh && bh <= 0x57) //是gb2312汉字
{
bool isFind = false;
for (int j = 0; j < _Allhz.Length; j++)
{
if (_Allhz[j][1].IndexOf(charary[i]) != -1)
{
rtnSb.Append(_Allhz[j][0]);
isFind = true;
break;
}
}
if (!isFind)
rtnSb.Append(charary[i]);
}
else
rtnSb.Append(charary[i]);
}
return rtnSb.ToString();
}
有一种简化操作是根据 gb2312 码表的编号按拼音排序这个原理来做的,但是只能处理 gb2312 码表内的汉字,并且无法处理多音字。简单的要求可以通过这个算法来完成,但实质还是查表。