今天在读取网页的时候出现一些问题,请问问题在哪里?昨天还没事情,源程序还是昨天的中间没动过,问题今天才有的..
问题如果图..
错误相关代码:
HttpWebRequest Request = (HttpWebRequest)WebRequest.Create(web); 
WebResponse Response   =  (HttpWebResponse)Request.GetResponse();
<a rel="mz" href="http://news.csdn.net/">新闻</a>
我取出http://news.csdn.net/和 新闻!写入datatable中.
datatable.Columns有两组一个是url,一个是title上面两个分别写入一一对应;
当然不符合格式的不读取..希望大家帮一下..谢谢

解决方案 »

  1.   

    public static string getUrltoHtml(string Url)
            {
                string errorMsg = string.Empty;
                try
                {
                    System.Net.WebRequest wReq = System.Net.WebRequest.Create(Url);
                    System.Net.WebResponse wResp = wReq.GetResponse();
                    System.IO.Stream respStream = wResp.GetResponseStream();
                    System.IO.StreamReader reader = new System.IO.StreamReader(respStream,System.Text.Encoding.GetEncoding("gb2312"));
                    string sResultContents = reader.ReadToEnd();
                    //byte[] bytes = System.Text.Encoding.UTF8.GetBytes(sResultContents);
                    ////取得的utf-8编码转换成gb2312编码///关键就这几句了   
                    //System.Text.Encoding utf8 = System.Text.Encoding.GetEncoding("utf-8");
                    //System.Text.Encoding gb2312 = System.Text.Encoding.GetEncoding("gb2312");
                    //System.Text.Encoding.Convert(utf8, gb2312, bytes);
                    //System.Text.Encoding.Convert(utf8, gb2312, bytes);  
                    return sResultContents;
                }
                catch (System.Exception ex)
                {
                    errorMsg = ex.Message;
                }
                return null;
            }
      

  2.   

    尝试了,可以读出大多数的网页。。
    但是主要在读某些网页出错,例如,bbs.dvbbs.net,不过问题应该不大,
    先谢谢