想从抓取的html代码里面获取一些数据,但不知道该如何进行。或者如何用正则表达式去抓取 本帖最后由 stormwen 于 2011-07-27 18:14:26 编辑 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 看了你写的这么清晰的结构,让我觉得这个的话,可以用DOM 用这个,比正则方便:http://www.cnblogs.com/youuuu/archive/2011/06/20/2085333.html 当初我就是substring出来滴~~~~~~~~把腾讯图书的小说一页一页的substring到文本文件了 给你一段示例代码:取出三个table。HtmlDocument htmlDoc = new HtmlDocument(); htmlDoc.LoadHtml(s); HtmlNodeCollection tables=htmlDoc.DocumentNode.SelectNodes(@"//table"); foreach (HtmlNode table in tables) Response.Write(table.OuterHtml); string str=Regex.Replace(yourhtml,"<[^>]*?>","");昨天督察的 看看你这好使不。 高分解决谷歌地图问题 不好意思 问个数据库的问题 递规 说说URL 重写的优缺点 菜鸟问题--在VS05中,如果把web开发界面设计,改为Gridlayout 大家觉得用iframe作为tip的显示是否可行? ASP.net 在下载文件出错 不知道为什么 求高手帮助 asp.net如何修改xml的数据 如何把items属性设置为只读? 如何显示绑定在DataGrid中的数据表的文本字段? 获取datalist点击列值 求高手 使用Forms设置网页浏览权限,跪求解决方案
把腾讯图书的小说一页一页的substring到文本文件了
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(s);
HtmlNodeCollection tables=htmlDoc.DocumentNode.SelectNodes(@"//table");
foreach (HtmlNode table in tables)
Response.Write(table.OuterHtml);