本帖最后由 stormwen 于 2011-07-27 18:14:26 编辑

解决方案 »

  1.   

    看了你写的这么清晰的结构,让我觉得这个的话,可以用DOM
      

  2.   

    用这个,比正则方便:http://www.cnblogs.com/youuuu/archive/2011/06/20/2085333.html
      

  3.   

    当初我就是substring出来滴~~~~~~~~
    把腾讯图书的小说一页一页的substring到文本文件了
      

  4.   

    给你一段示例代码:取出三个table。
    HtmlDocument htmlDoc = new HtmlDocument();
    htmlDoc.LoadHtml(s);
    HtmlNodeCollection tables=htmlDoc.DocumentNode.SelectNodes(@"//table");
    foreach (HtmlNode table in tables)
    Response.Write(table.OuterHtml);
      

  5.   

    string str=Regex.Replace(yourhtml,"<[^>]*?>","");昨天督察的 看看你这好使不。