<tr>
<td height="23" align="left" class="td_hui"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="85%">·
<a href="Infor_View.aspx?ArticleId=2924" class="">
张时善同志在安全生产工作现场会上...</a><font color="black">
</td>
</tr>
</table></td>
</tr>
<tr>
<td height="23" align="left" class="td_hui"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="85%">·
<a href="Infor_View.aspx?ArticleId=2687" class="">
张时善同志在全市暑期安全生产工作...</a><font color="black">
</td>
</tr>
</table></td>
</tr>
我要做个新闻采集功能,我要采集别的网站的新闻,上面是网站查看源文件的代码,我要采集的是 <a href="Infor_View.aspx?ArticleId=2687" class="">
张时善同志在全市暑期安全生产工作...</a>求正则高手帮助,谢谢
<td height="23" align="left" class="td_hui"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="85%">·
<a href="Infor_View.aspx?ArticleId=2924" class="">
张时善同志在安全生产工作现场会上...</a><font color="black">
</td>
</tr>
</table></td>
</tr>
<tr>
<td height="23" align="left" class="td_hui"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="85%">·
<a href="Infor_View.aspx?ArticleId=2687" class="">
张时善同志在全市暑期安全生产工作...</a><font color="black">
</td>
</tr>
</table></td>
</tr>
我要做个新闻采集功能,我要采集别的网站的新闻,上面是网站查看源文件的代码,我要采集的是 <a href="Infor_View.aspx?ArticleId=2687" class="">
张时善同志在全市暑期安全生产工作...</a>求正则高手帮助,谢谢
解决方案 »
- select中option的值如何选中并赋值给后台。
- TreeView如何返回节点和选择节点下子节点的Value
- 由于执行一个需要3~4分钟能完成的存储过程,存储过程还没完就弹出错误:the server request timed out
- 无法查看设计器
- web程序的安装问题!!急!跪求高手!
- asp.net版本冲突
- 为什么这个得不到值
- 急问:有谁知道在asp.net中文件上传,允许文件上传的最大容量是多少?不剩感激!!!
- session保存不了
- 关于Push模式的水晶报表问题!(急!!!)
- 请教个问题,用JS的window.open打开本地路径提示 拒绝访问
- 求解释下面的一段JQUERY代码的意思
{
string str = sr.ReadToEnd();
str = System.Text.RegularExpressions.Regex.Match(str, @"<a [^>]*2687[^>]*>((?!</a>)[\s\S])*</a>").Value;
Console.WriteLine(str);
}
string html = @"<tr>
<td height=""23"" align=""left"" class=""td_hui""><table width=""100%"" border=""0"" cellspacing=""0"" cellpadding=""0"">
<tr>
<td width=""85%"">·
<a href=""Infor_View.aspx?ArticleId=2924"" class="""">
张时善同志在安全生产工作现场会上...</a><font color=""black"">
</td>
</tr>
</table></td>
</tr>
<tr>
<td height=""23"" align=""left"" class=""td_hui""><table width=""100%"" border=""0"" cellspacing=""0"" cellpadding=""0"">
<tr>
<td width=""85%"">·
<a href=""Infor_View.aspx?ArticleId=2687"" class="""">
张时善同志在全市暑期安全生产工作...</a><font color=""black"">
</td>
</tr>
</table></td>
</tr>
我要做个新闻采集功能,我要采集别的网站的新闻,上面是网站查看源文件的代码,我要采集的是 <a href=""Infor_View.aspx?ArticleId=2687"" class="""">
张时善同志在全市暑期安全生产工作...</a>求正则高手帮助,谢谢
";
html = Regex.Replace(html, @"\r|\n|\t", "");
Regex reg = new Regex(@"\<a.*?ArticleId.*?\/a\>", RegexOptions.IgnoreCase);
List<string> links = new List<string>();
foreach (Match m in reg.Matches(html))
{
links.Add(m.Value);
}
foreach (var r in links)
{
Response.Write(r + "<br>");
}
}
结果
<a href="Infor_View.aspx?ArticleId=2924" class=""> 张时善同志在安全生产工作现场会上...</a>
共三条。
string html = @ " <tr>
<td height= " "23 " " align= " "left " " class= " "td_hui " "> <table width= " "100% " " border= " "0 " " cellspacing= " "0 " " cellpadding= " "0 " ">
<tr>
<td width= " "85% " "> ·
<a href= " "Infor_View.aspx?ArticleId=2924 " " class= " " " ">
张时善同志在安全生产工作现场会上... </a> <font color= " "black " ">
</td>
</tr>
</table> </td>
</tr>
<tr>
<td height= " "23 " " align= " "left " " class= " "td_hui " "> <table width= " "100% " " border= " "0 " " cellspacing= " "0 " " cellpadding= " "0 " ">
<tr>
<td width= " "85% " "> ·
<a href= " "Infor_View.aspx?ArticleId=2687 " " class= " " " ">
张时善同志在全市暑期安全生产工作... </a> <font color= " "black " ">
</td>
</tr>
</table> </td>
</tr>
我要做个新闻采集功能,我要采集别的网站的新闻,上面是网站查看源文件的代码,我要采集的是 <a href= " "Infor_View.aspx?ArticleId=2687 " " class= " " " ">
张时善同志在全市暑期安全生产工作... </a> 求正则高手帮助,谢谢
";
html = Regex.Replace(html, @ "\r|\n|\t ", " ");
Regex reg = new Regex(@ "\ <a.*?ArticleId.*?\/a\> ", RegexOptions.IgnoreCase);
List <string> links = new List <string> ();
foreach (Match m in reg.Matches(html))
{
links.Add(m.Value);
}
foreach (var r in links)
{
Response.Write(r + " <br> ");
}
}
这个正则只适合你给的html,应该有一些更明确的限定
谢谢你,我想抓取 http://www.tjsafety.gov.cn 这个网站的新闻,你的出来好像有很多其他的内容,我还是 要下面这样新闻的内容,不要图片新闻,你给看看如何获取到,谢谢了!!!
<a href= "Infor_View.aspx?ArticleId=2687 " class= " ">
张时善同志在全市暑期安全生产工作... </a>
谢谢你,我想抓取 http://www.tjsafety.gov.cn 这个网站的新闻,你的出来好像有很多其他的内容,我还是 要下面这样新闻的内容,不要图片新闻,你给看看如何获取到,谢谢了!!!
<a href= "Infor_View.aspx?ArticleId=2687 " class= " ">
张时善同志在全市暑期安全生产工作... </a>
<a href= "Infor_View.aspx?ArticleId=2687 " class= " ">
张时善同志在全市暑期安全生产工作... </a>
(?is)<td width="85%">\s*?(<a[^>]*>.*?</a>)<font color="black">.*?</td>
<a href= "Infor_View.aspx?ArticleId=2687 " class= " ">
张时善同志在全市暑期安全生产工作... </a>