最近小弟编写一个蜘蛛程序,但是抓的文本实在是五花八门,我只想要中文字符却不知道该怎么办,
还有WebRequest类怎么指定编码啊,我下的好多都是乱吗
还有WebRequest类怎么指定编码啊,我下的好多都是乱吗
解决方案 »
- 如何控制TreeView的尺寸? asp.net
- 关于Threading.Timer和Forms.Timer的问题
- graphics到底怎么用啊
- Bitmap和String之间的转换
- [4.0][Entity Framework][DataGridView]add时DataGridView无反应,但是Delete的时候正常刷新
- vs2003启动时变成“无响应”,20秒后一切正常,连系统错误事件也没记录,大家有办法么?
- 调用外部应用程序的问题,请帮帮忙!谢谢了!
- C#调用JAVA短信平台发送短信乱码的问题(长久没解决)
- 在.net中,如果正确接收gb2312编码的网页中Post过来的数据?
- 正则表达式将html解析为xml文件的问题
- 能否修改AppDomain.CurrentDomain.BaseDirectory
- 如何记录查找到的字符串的位置?为什么调试程序时机器和死机了似的?
Int16 unicode = Convert.ToInt16( c );
html = Encoding.GetEncoding("GB2312").GetString( 字节数组 );
ASCII值的方法取得string str = "tthisfll这AAl是lll汉。/字";
for(int i=0;i<str.Length;++i)
{
if ( (str[i] <= '酨') && (str[i] >= '啊'))
{
Console.WriteLine("中文:" + str[i]);
}
} 以上代码输出:中文:这
中文:是
中文:汉
中文:字
我写了一个函数可以判断是不是汉字。我够热心了吧。bool IsChineseChar(char ch)
{
byte[] bytes = System.Text.Encoding.GetEncoding("gb2312").GetBytes(ch.ToString());
if (bytes.Length != 2)
{
return false;
} int zone = bytes[0];
int num = bytes[1];
return (zone >= 0xB0 && zone <=0xF7) && (num >0xA0 && num<0xFD);
}