就是在网页源代码里的下载地址URL  怎么处理成下载包的源地址比如下面这个网页里面的 免费下载到电脑的URL 代码里面的那个地址找不到 怎么处理成可以下载的源地址http://www.moxiu.com/themes/22/2009/0729/4852869.shtml请高手帮我看看  急 谢谢了

解决方案 »

  1.   

    那可能要处理,Response回来的字符流了。
      

  2.   

    http://www.moxiu.com/ + 源码里的地址(如果源码里的地址非以http://开头,如果以../开头,则直接将../替换为http://www.moxiu.com/)
      

  3.   

    获取文件流 经过判断如果是WWW.xxx.com ro www.xxx.cn格式的就取出存储
      

  4.   

    http 300 url重定向,你需要获取重定向后的url进行下载.
      

  5.   

    HttpWebRequest.AllowAutoRedirect 属性 
    public bool AllowAutoRedirect { get; set; }置为false即可,
    默认值为 true
      

  6.   

    我这里有段代码,就是获取所有A标记,且取出其中href地址,以及innerText内容
    static void fun2()
            {
                string x =“获取的网站html代码”;
                Regex r = new Regex("<a.*?href=[\"\']{0,1}(?<h>.*?)(?= |\"|\'|>)(.*?>)(?<inner>.*?)</a>");
                MatchCollection ms = r.Matches(x);
                Console.WriteLine(ms.Count);
                foreach (Match m in ms)
                {
                    Console.WriteLine("all:" + m.Groups[0].Value);
                    Console.WriteLine("href:" + getURL(m.Groups["h"].Value));
                    Console.WriteLine("inner:" + m.Groups["inner"].Value);
                    Console.WriteLine();
                }
            }
            static string getURL(string url)
            {
                while(url.IndexOf(".") == 0 || url.IndexOf("/") == 0)
                {
                  url=url.Remove(0, 1);
                }
             //这里的http就是网站主域名(如http://www.51qsx.com/)自己定义字段哦,我没定义
                url = url.IndexOf("http://") == -1 ? http + url : url;
                return url;
            }