我想取出网页源代码中所有以"http://www.home160.net"开头的链接,正则表达式应该怎么写
如;<a href="http://www.home160.net/home160sz/aspx?ID=45&Top=45" target="_blank">sss</a>
我想取出的结果为:http://www.home160.net/home160sz/aspx?ID=45&Top=45
欢迎高手指点
如;<a href="http://www.home160.net/home160sz/aspx?ID=45&Top=45" target="_blank">sss</a>
我想取出的结果为:http://www.home160.net/home160sz/aspx?ID=45&Top=45
欢迎高手指点
解决方案 »
- (100分急求)关于webBrowser.Navigate post数据的问题
- datagridview行数问题
- C# 汉字拼音(需要声调)
- 在IE中直接输入路径可以播放,嵌入网页播放不了,路径完全正确,流媒体问题.
- 即将参加C#.NET的三个月培训.散分.问一下大家需要预习什么.我有一些基础.
- 一个关于FreeTextBox的问题
- [求助]中文传递的问题,让人苦恼
- 求socket 信息传递 做成dll模式关键部份源码或者思路
- Devexpress RichEdit 支持打开word、execl及pdf文档吗
- 如何知道datagrid的row行数????
- 求救,SQL Server连接问题
- 如何定义不固定的字符串数组的大小
(h|H)(r|R)(e|E)(f|F) *= *('|")?(\w|\\|\/|\.)+('|"| *|>)?
using System.Collections;
using System.Text.RegularExpressions;public class MyClass
{
public static void Main()
{
String input = "<a href=\"http://www.home160.net/home160sz/aspx?ID=45&Top=45\" target=\"_blank\">sss</a>";
String pattern = "<a href\\s*=\\s*[\"']{0,1}(?<URL>(http://www.home160.net[^(\"|')]*))(\"|'){0,1}[^>]*>[^<]*</a>";
Regex r = new Regex(pattern, RegexOptions.IgnoreCase);
String result = "";
result = r.Replace(input, "${URL}");
Console.WriteLine(result);
Console.ReadLine();
}
}
Group[1]即:
Regex r = new Regex(rule,RegexOptions.Compiled);//rule 为正则表达式
foreach(Match match in r.Matches(input))
{
match.Groups[1].ToString();
}