如何根据一个url获取页面上所有的链接
比如说根据http://www.csdn.net获取http://subject.csdn.net/VS2010%5Ftec/这样的内容

解决方案 »

  1.   

    得到页面的返回的所有源文件,用正则分析以http://打头的就可以了。
      

  2.   

    这个??
    我目前不会的就是如何获取页面的源文件,如何用正则表达式分析http://打头的,谁有更全面的思路,有源码最好
      

  3.   

    <%@ page language=c# %>
    <%@ Import Namespace="System.Net"%>
    <%@ Import Namespace="System.IO"%>
    <script runat="server">
    void Page_Load()
    {
    string rl;
    WebRequest myReq=WebRequest.Create("http://www.stacktrace.cn");
    WebResponse myRes=myReq.GetResponse();
    Stream resStream=myRes.GetResponseStream();
    StreamReader sr=new StreamReader(resStream,Encoding.Default);
    StringBuilder sb=new StringBuilder();
    while((rl=sr.ReadLine())!=null)
    {
    sb.Append(rl);
    }
    result.Text=sb.ToString();
    myRes.Close();
    }以上是用来获取页面源文件的代码,至于分析链接么就用正则拿去http开头到空格结束的url即可