网上搜了很多有关提取HTML源码中的超链接的正则,不过有些是没有完整的获取超连接。
能给我提供你们认为最好的一个正则表达式。。
能给我提供你们认为最好的一个正则表达式。。
解决方案 »
- VS2010编译时报错:'SelectByName' is not supported by language
- 开发一个MIS系统,除了使用ORM技术外,还有没有其它更方便高效的方法、技术、工具?
- 寻求C#中一次执行多条sql语句的方法代码
- Help:用.net制作安装包时,如何在安装SQL数据库的同时把已经做好的全文检索也装到数据库!!
- 求C#.NET的购物车的源代码?
- 困惑的非常糊涂,MDI窗体的问题,居然会出两套按钮,详细情看我的图
- 请教如何使用NetWorkStream 传送大文件,我这里传超过40k的文件就停住不动了
- 客户端的windows应用程序从远程服务器实现下载的功能,都有那些好办法?
- 准备用C#开发一个繁体转简体的组件,但不知如何下手?大家给个思路,谢谢!!!
- 谁能帮我理解"接口"
- 关于C#语法```
- 如何判断一个文本文件是否被占用?何时被释放?
Regex re = new Regex(@"(?is)(?<=<a[^>]*href=\s*[""']).*?(?=[""'][^>]*>)", RegexOptions.None);
MatchCollection mc = re.Matches("你要提取的");
foreach (Match ma in mc)
{
//ma.Value是你要的
}
不要标签,只要提取它的http://www.nur.cn/news.php部分,
我的意思是在整个html源码中抽取这样的超链接,href开头的
string htmsStr = @"<div class=""fans_top"" id=""weibo_head"">
<a href=""http://baidu.com/"" target=""_blank"">评论(0)</a>
<div>dddd</div>
</div><div class=""ddd"" id=""ccc"">
<a href=""http://baidu.com/"" target=""_blank"">评论(20)</a>
<a href=""http://baidu.com/"" target=""_blank"">评论(150)</a>
</div>
";
Regex re = new Regex("(?is)<a\\s*href=\"(?<html>(.*?))\"\\s*[^>]*>[^<]*</a>");
MatchCollection mt = re.Matches(htmsStr);
List<string> path = new List<string>();
foreach (Match m in mt)
{
path.Add(m.Groups["html"].Value);//结果在path中
}