难的来了,用正则表达式匹配网页中所有连接 要求匹配所有 能用鼠标点击的连接 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 基本的如:<a href=*>**</a><iframe src=*><iframe><a href=# onclick=*>*</a>等 <(?<sun>(a|iframe)+).*?>.*?</?\k<sun>.*?>里面只写了A和IFRAME的 别的自己添加吧 +号多余了 不要<(?<sun>(a|iframe)).*?>.*?</?\k<sun>.*?> 大概是这样string a="<a href='ftp://topic.csdn.net/t/\'<t";Regex rex=new Regex("(http|ftp)://.+(?='|\")");a=rex.Match(a).Value;//(http|ftp)这个自己扩充如(http|ftp|udp)一般是以'或"结尾 如有其他也自己扩充 (?<=((?:src|href|url|background)(?:\s*=\s*(["']?))))(?:[^\s"'>]*)用这个可以找出除FLASH几乎所有可能存在的连接FLASH的连接是写在Value里面的上面这条语句假设<a href="XXXXXX">xxxxxx</a>match获取的是 连接内容即 XXXXXXgroup 1 获取的是 前缀 href=" 注:上面语句可以分辨是 双引号 单引号 空group 2 获取的是 包围符号 即 双引号 单引号 空如果你想获取全部连接内容包括前缀用下面这句((?:src|href|url|background)(?:\s*=\s*(["']?)))(?:[^\s"'>]*)[\s"']?match获取的是 全部连接内容即 href="XXXXXX"group 1 获取的是 前缀 href=" 注:上面语句可以分辨是 双引号 单引号 空group 2 获取的是 包围符号 即 双引号 单引号 空 gzdiablo() :21312sfdr<a href="XXXXXX">xxxxxx</a>asdf结果是返回包含所有连接标记的:<a href="XXXXXX">xxxxxx</a>我想获取上述匹配呢? 这个就是获取A标签了你用这个<(" + 标签名称+ ")[^>]*>(\s*|.)*</\1>这个是获取需要关闭标签的标签 即 <XXX></XXX> 的标签 不过不支持嵌套支持嵌套的不太好写实际是<(a)[^>]*>(\s*|.)*</\1>这样就能获取全部A标签 其他标签同理如果有多种标签就这样写 (a|XXX|xxx)如果是不需要关闭标签的标签 即 <XXX >的 如<img src="xxx" height="xxx" ...>就简单多了<(" + 标签名称+ ")[^>]*>用这个就行了 感谢gzdiablo() 以后向你请教,还请多多帮助! 问个简单而又复杂的问题、 如何直接切换至父窗口某一个tabpage 请教一个web.config设置 求vs2005.net 下载地址 数据库的连接问题! 从string中判断是否包含某字母? 關於IssueVision asp.net里面怎么在这个页面传参数到另外一个叶面并打开 在C#中,我如何把一句话画成一张图片保存呢。比如我随便写了一句话,就可以保存为一张图片了呢? vs.net我做的系统开始是建成windows 应用程序 我想再浏览器里打开,怎么打开 如果转换成ASP.NET Web 应用程序 怎样转 如何获取当前文本框光标的坐标? 一百分求变态SQL代码,在线等。答对全得。
<iframe src=*><iframe>
<a href=# onclick=*>*</a>
等
里面只写了A和IFRAME的 别的自己添加吧
<(?<sun>(a|iframe)).*?>.*?</?\k<sun>.*?>
string a="<a href='ftp://topic.csdn.net/t/\'<t";
Regex rex=new Regex("(http|ftp)://.+(?='|\")");
a=rex.Match(a).Value;
//(http|ftp)这个自己扩充如(http|ftp|udp)
一般是以'或"结尾 如有其他也自己扩充
用这个可以找出除FLASH几乎所有可能存在的连接
FLASH的连接是写在Value里面的
上面这条语句
假设<a href="XXXXXX">xxxxxx</a>
match获取的是 连接内容即 XXXXXX
group 1 获取的是 前缀 href=" 注:上面语句可以分辨是 双引号 单引号 空
group 2 获取的是 包围符号 即 双引号 单引号 空如果你想获取全部连接内容包括前缀用下面这句
((?:src|href|url|background)(?:\s*=\s*(["']?)))(?:[^\s"'>]*)[\s"']?
match获取的是 全部连接内容即 href="XXXXXX"
group 1 获取的是 前缀 href=" 注:上面语句可以分辨是 双引号 单引号 空
group 2 获取的是 包围符号 即 双引号 单引号 空
21312sfdr<a href="XXXXXX">xxxxxx</a>asdf结果是返回包含所有连接标记的:<a href="XXXXXX">xxxxxx</a>我想获取上述匹配呢?
你用这个
<(" + 标签名称+ ")[^>]*>(\s*|.)*</\1>
这个是获取需要关闭标签的标签 即 <XXX></XXX> 的标签 不过不支持嵌套支持嵌套的不太好写
实际是
<(a)[^>]*>(\s*|.)*</\1>
这样就能获取全部A标签 其他标签同理
如果有多种标签就这样写 (a|XXX|xxx)如果是不需要关闭标签的标签 即 <XXX >的 如<img src="xxx" height="xxx" ...>
就简单多了
<(" + 标签名称+ ")[^>]*>
用这个就行了