C#抓取网页中含有特定字符串的链接 如题如腾讯NBA页面http://sports.qq.com/nba/我要获取该页面所有含有“/a/201301”的链接地址,存储到c:/sport_url.txt请问如何实现 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 正则得写死吧?我要想实现的是给用户一个text输入框,用户可以自定义这个字符串,然后爬取含有此字符串的所有链接。 string url = "http://sports.qq.com/nba/"; string html = GetHtml(url, Encoding.GetEncoding("gb2312")); string str = "/a/201301"; string pattern = @"(?is)(?<=<a[^>]*?href=[""'])[^""']*?" + str + @"[^""']*[""'](?=[^>]*>)"; var ary = Regex.Matches(html, pattern).OfType<Match>().Select(t => t.Value).ToArray(); 先匹配出所有连接地址,然后IndexOf,如果用户输入的有些字符不太规范的话,拼接正则有可能会出现错误的表达式额~ 关于面向对象粒度问题. 怎样较快的合理学习用.net开发个网站 c# 简单又棘手问题,在线等。 有谁知道Microsoft Maked Edit Control 控件处用? 100分求正则表达式!!!!!!!!!!!!!! TCP客户端通过03功能码读取Modbus TCP服务端的寄存器数据 窗体之间数据传递。。。。急 用gridview做下载 JS数组去掉重复 关于CheckBox控件,这段代码怎么写? C#递归程序 我用webBrowser来显示网页,网站限制了粘贴,在webBrowser1中怎么去除限制
我要想实现的是给用户一个text输入框,用户可以自定义这个字符串,然后爬取含有此字符串的所有链接。
string html = GetHtml(url, Encoding.GetEncoding("gb2312"));
string str = "/a/201301";
string pattern = @"(?is)(?<=<a[^>]*?href=[""'])[^""']*?" + str + @"[^""']*[""'](?=[^>]*>)";
var ary = Regex.Matches(html, pattern).OfType<Match>().Select(t => t.Value).ToArray();