1.已经获得网页HTML
WebRequest request = WebRequest.Create(webUrl);
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
return reader.ReadToEnd();2.查找<a href="/pages/company.aspx?version=cn&corpid=1111111111" class="name" target="_blank">AAAAAAAAAAAA</a>标记
3.得到corpid=1111111111 以及 AAAAAAAAAA使用Regex以及正则表达式实现,请问2,3步如何编写?谢谢啦!!!
WebRequest request = WebRequest.Create(webUrl);
WebResponse response = request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
return reader.ReadToEnd();2.查找<a href="/pages/company.aspx?version=cn&corpid=1111111111" class="name" target="_blank">AAAAAAAAAAAA</a>标记
3.得到corpid=1111111111 以及 AAAAAAAAAA使用Regex以及正则表达式实现,请问2,3步如何编写?谢谢啦!!!
解决方案 »
- 视频通过av输出到电视机
- 问大家一个问题:关于winform 程序的这个效果是怎么实现的?用qq举例~
- 挑战高手——————c#写ini文件不需要键值直接写入value
- 有这样一个数列:分子成等差数列,分母成等比数列,求这个数列的和S
- 这段数据库简单操作代码哪里错了?
- b/s结构中怎么样记录适时的在线用户阿?
- 求一文件的算法,顶者有分。谢谢
- 请教,如何使用C#在MDI的子FORM中包含MS-WORD,不是另外启动一个WORD
- 估计非思归不能解决!!! 全文检索结果的物理路径获得问题!
- 如何根据用户的权限动态地生成菜单?
- 请教:C#调用接口中含有结构参数的dll动态库问题。。
- 如何判断一个控件的可见性!
string s = "..";
Regex re = new Regex(@"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
Match m = re.Match(s);
if(m.Success)
{
string link = m.Groups["href"].Value;
string text = Regex.Replace(m.Groups["text"].Value,"<[^>]*>","");
Console.WriteLine("link:{0}\ntext:{1}", link, text);
}
string No = "<a href=\"/pages/company.aspx?version=cn&corpid=1111111111\" class=\"name\" target=\"_blank\">AAAAAAAAAAAA </a>";// Console.ReadLine();
Regex re = new Regex("<a\\s+href=\".*?&(.*?)\".*?>(.*?)</a>");
MatchCollection mc = re.Matches(No);
foreach (Match m in mc)
{
for (int i = 0; i < m.Groups.Count;i++)
{
Console.WriteLine("Group " + i + ": " + m.Groups[i].Value);
}
}
Regex re = new Regex(@"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
Match m = re.Match(s);
if(m.Success)
{
string link = m.Groups["href"].Value;
string text = Regex.Replace(m.Groups["text"].Value,"<[^>]*>","");
Console.WriteLine("link:{0}\ntext:{1}", link, text);
}
foreach(Match m in reg.Matches("你的网页代码"))
{
string link=m.Groups["link"].Value;//结果是/pages/company.aspx?version=cn&corpid=1111111111
string text=m.Groups["text"].Value;//结果是AAAAAAAAAA
}