我现在能获取源代码 但是不能得到某个标签里的内容 请问这个过程如何实现啊,我从网上查到很多文章还是看不明白 没前没后的
系统地 给个完整的例子就更好了
1,获取源代码
2,???
3,???
......

解决方案 »

  1.   

    ls的正解
    另外你可以用webbrowser试试。里面的document,elements可以抓取你想要的任何东西。
      

  2.   

    //td.text 是我获取的源代码$str=td.text;//赋值
    if(preg_match(@"<font[^>]*>([\s\S]*?)</font>",$str))//判断
    {
    match.Groups["content"].ToString()//获取
    }不好意思,这是我左拼右凑的,有什么问题吗
    还有就是如何把content的内容显示出来
      

  3.   

    问题 基本解决了 感谢大家 感谢csdn!!我爱你们!!!!
      

  4.   

    用正则表达式 public void GetHttpUrl(string htmlSource)
            {
                             //用正则表达式识别URL超链接进规则查询Url:
                 Regex UrlRegex = new Regex(@"(http:\/\/([\w.]+\/?)\S*)", RegexOptions.IgnoreCase | RegexOptions.Compiled);
               
                MatchCollection matches = UrlRegex.Matches(htmlSource);
                foreach (Match match in matches)
                {                                   arrHttp.Add(match.Value.ToString());            }        }