各位好,最近我在做一个网页抓取时碰到点问题,求大虾指教
我要抓取的网页是德语的,应该是iso-8859-1的编码然后我用
WebClient client = new WebClient();
client.Encoding = System.Text.Encoding.GetEncoding("ISO-8859-1");
string strHTML = client.DownloadString(URL);得到网页的string问题是有些单词中间多了连字符
例如Java Ent­wick­ler / De­vel­oper (m/w)变成了 Java Ent-wick-ler然后我用string的replace方法想去掉那个-
结果原本有连接符的地方就出现乱码很是奇怪恳请大虾解答,谢谢编码