我用webclient down 过来的页面中有很多的
<cite>
<a c="1" href="http://www.deyi.com/space-uid-48025.html" mid="DRKtpIhCmmXZaoEXYKIYOLWYaWQEZWDH" id="ajaxid_0.7930081481989826">XXXXXXXXXXXX</a>
</cite>
我现在想把 这个 cite 的 a标签的内容提取出来 应该如何写啊??? 求教了 不会搞正则啊!!!
<cite>
<a c="1" href="http://www.deyi.com/space-uid-48025.html" mid="DRKtpIhCmmXZaoEXYKIYOLWYaWQEZWDH" id="ajaxid_0.7930081481989826">XXXXXXXXXXXX</a>
</cite>
我现在想把 这个 cite 的 a标签的内容提取出来 应该如何写啊??? 求教了 不会搞正则啊!!!
解决方案 »
- 这段代码,大家帮忙看看哪里有问题(简单)
- 由VB转向C#发现很多异同,故问:System.Web.UI.Design.ControlDesigner中DesignTimeElement属性如何付值
- asp.net从入门到精通视频教程的下载地址
- 绝对高手请进!!
- 菜鸟问题:为什么得不到DropDownList中选择的项?
- 一个页面里有两个IFRAME,使这两个子页面有联系
- widnows 2003下开发的程序在2000下不能运行!!
- 能否将datatable的数据插入到数据库中?
- 请教 JS中后台参数传到前台,前台无法获取
- 大家看看这句怎么了,不好使了
- datalist button Click事件获取 这一行的ID 在线等 跪求高手指点
- 关于文章抓取的问题
<a c=""1"" href=""http://www.deyi.com/space-uid-48025.html"" mid=""DRKtpIhCmmXZaoEXYKIYOLWYaWQEZWDH"" id=""ajaxid_0.7930081481989826"">XXXXXXXXXXXX</a>
</cite><cite>
<a c=""1"" href=""http://www.deyi.com/space-uid-48025.html"" mid=""DRKtpIhCmmXZaoEXYKIYOLWYaWQEZWDH"" id=""ajaxid_0.7930081481989826"">AAAAAAAAAAAA</a>
</cite>";
Regex reg = new Regex(@"(?is)(?<=<cite>(?:(?!</?cite).)*)<a[^>]*?>(.*?)</a>");
foreach (Match m in reg.Matches(str))
Console.WriteLine(m.Groups[1].Value);
private ArrayList GetHyperlinkElemID(string text)
{
ArrayList al = new ArrayList();
Regex reg = new Regex(@"<a([^>]+)?\s+id=('|"")([\w]+)('|"")\s*([^>]+)?>([^<>]*((?<G><[\w]+\s*[^>]*>)[^<>]*)+((?<-G></[\w]+>)[^<>]*)+)*</a>"
, RegexOptions.IgnoreCase | RegexOptions.Multiline);
foreach (Match mt in reg.Matches(text))
{
string a = mt.Value;//这里是<a>的html代码 展示用 没保存
al.Add(mt.Result("$3"));//这里是id
}
return al;
}
{
ArrayList al = new ArrayList();
Regex reg = new Regex(@"<a([^>]+)?\s+id=('|"")([\w]+)('|"")\s*([^>]+)?>([^<>]*((?<G><[\w]+\s*[^>]*>)[^<>]*)+((?<-G></[\w]+>)[^<>]*)+)*</a>"
, RegexOptions.IgnoreCase | RegexOptions.Multiline);
foreach (Match mt in reg.Matches(text))
{
string a = mt.Value;//这里是<a>的html代码 展示用 没保存
al.Add(mt.Result("$3"));//这里是id
}
return al;
}