关于抓取源码,在线等 目标网页数据展示使用的是GridView,也是使用它自带的分页,怎么获取之后的数据? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 难道GridView也承认URL参数吗? Regex regContent = new Regex("<div id=\"artibody\">(?<content>.*?)([\\s\\S]*)?</div>", RegexOptions.IgnoreCase | RegexOptions.Multiline); string contents = regContent.Match(html).Value;//得到文章内容 string finalContent = ""; ArrayList urlList = new ArrayList(); if (content.IndexOf("下一页") != -1) {//如果存在下一页,说明有多页 Regex regUrl = new Regex("<a\\s+href='(?<url>.*?)'>", RegexOptions.Multiline | RegexOptions.IgnoreCase);//获取下一页里面的链接 MatchCollection matches = regUrl.Matches(content); foreach (Match match in matches) { string childurl = match.Groups["url"].Value;//得到多页网页的网址列表 if (urlList.Contains(childurl)) { urlList.Add(childurl); } } finalContent += content.Substring(0, content.IndexOf("<div style=\"text-align:center;\">")) + "</div>"; } else { //没有下一页截取成功 finalContent = content; } 网站发布后的悲剧,请大家帮忙 .net如何像hibernater那样映射POJO类 (转)关于在存储过程中阿拉伯数字转换成大写汉字的好程序 网页查看权限的控制,为什么这样不能转跳页面? DataField 绑定值的问题 [疑问]imagebutton抢占回车事件? 投票系统的图片如何显示? 用IIS中的SMTP发送邮件不报错但收不到的问题 replace的问题 GridView按序排列问题 gridview里面的checkbox定义一个OnCheckedChanged为何没有用 个性下拉菜单效果
string contents = regContent.Match(html).Value;//得到文章内容
string finalContent = "";
ArrayList urlList = new ArrayList(); if (content.IndexOf("下一页") != -1)
{//如果存在下一页,说明有多页
Regex regUrl = new Regex("<a\\s+href='(?<url>.*?)'>", RegexOptions.Multiline | RegexOptions.IgnoreCase);//获取下一页里面的链接
MatchCollection matches = regUrl.Matches(content); foreach (Match match in matches)
{
string childurl = match.Groups["url"].Value;//得到多页网页的网址列表
if (urlList.Contains(childurl))
{
urlList.Add(childurl);
}
}
finalContent += content.Substring(0, content.IndexOf("<div style=\"text-align:center;\">")) + "</div>";
}
else {
//没有下一页截取成功
finalContent = content;
}