我想获取一个网页的内容,但不是全部内容,只是想得到内容中的帖子的标题,我是先获取整个网页:
$contents = file_get_contents($url);但如何用正则表达式过滤得到我要的内容上我就犯难了,因为我不会用正则表达式,
比如说下面的代码
<tr bgcolor=#F0F0F0>
<td align="center">2</td>
<td align="center" style="font-size: 9pt">校园</td>
<td align="center" style="font-size: 9pt"><a href=# onclick="this.document.fsearch1.search_type.value='from_user';this.document.fsearch1.keyword.value='校团委';this.document.fsearch1.dayy.value='30#一个月';this.document.fsearch1.searchb1.click();">校团委</a></td>
<td><b><font color=red>|置顶|</font></b>
<a href="view.asp?id=198879" target=_blank>·<b>南非世界杯赛事观看场地安排(不断更新)</b></a></td>
<td align="center" style="font-size: 9pt">2010.6.24</td>
<td align="center"></td>
</tr> <tr bgcolor=#F0F0F0>
<td align="center">20</td>
<td align="center" style="font-size: 9pt">校园</td>
<td align="center" style="font-size: 9pt"><a href=# onclick="this.document.fsearch1.search_type.value='from_user';this.document.fsearch1.keyword.value='校工会';this.document.fsearch1.dayy.value='30#一个月';this.document.fsearch1.searchb1.click();">校工会</a></td>
<td>
<a href="view.asp?id=199694" target=_blank>·<b>游泳比赛成绩公告</b></a></td>
<td align="center" style="font-size: 9pt">2010.6.26</td>
<td align="center"></td> </tr>
我只想获取红色部分的文字,其他的都不要,应该要怎么才能实现呢,正则表达式怎么写,请教了
$contents = file_get_contents($url);但如何用正则表达式过滤得到我要的内容上我就犯难了,因为我不会用正则表达式,
比如说下面的代码
<tr bgcolor=#F0F0F0>
<td align="center">2</td>
<td align="center" style="font-size: 9pt">校园</td>
<td align="center" style="font-size: 9pt"><a href=# onclick="this.document.fsearch1.search_type.value='from_user';this.document.fsearch1.keyword.value='校团委';this.document.fsearch1.dayy.value='30#一个月';this.document.fsearch1.searchb1.click();">校团委</a></td>
<td><b><font color=red>|置顶|</font></b>
<a href="view.asp?id=198879" target=_blank>·<b>南非世界杯赛事观看场地安排(不断更新)</b></a></td>
<td align="center" style="font-size: 9pt">2010.6.24</td>
<td align="center"></td>
</tr> <tr bgcolor=#F0F0F0>
<td align="center">20</td>
<td align="center" style="font-size: 9pt">校园</td>
<td align="center" style="font-size: 9pt"><a href=# onclick="this.document.fsearch1.search_type.value='from_user';this.document.fsearch1.keyword.value='校工会';this.document.fsearch1.dayy.value='30#一个月';this.document.fsearch1.searchb1.click();">校工会</a></td>
<td>
<a href="view.asp?id=199694" target=_blank>·<b>游泳比赛成绩公告</b></a></td>
<td align="center" style="font-size: 9pt">2010.6.26</td>
<td align="center"></td> </tr>
我只想获取红色部分的文字,其他的都不要,应该要怎么才能实现呢,正则表达式怎么写,请教了
<tr bgcolor=#F0F0F0>
<td align="center">2</td>
<td align="center" style="font-size: 9pt">校园</td>
<td align="center" style="font-size: 9pt"><a href=# onclick="this.document.fsearch1.search_type.value='from_user';this.document.fsearch1.keyword.value='校团委';this.document.fsearch1.dayy.value='30#一个月';this.document.fsearch1.searchb1.click();">校团委</a></td>
<td><b><font color=red>|置顶|</font></b>
<a href="view.asp?id=198879" target=_blank>·<b>南非世界杯赛事观看场地安排(不断更新)</b></a></td>
<td align="center" style="font-size: 9pt">2010.6.24</td>
<td align="center"></td>
</tr> <tr bgcolor=#F0F0F0>
<td align="center">20</td>
<td align="center" style="font-size: 9pt">校园</td>
<td align="center" style="font-size: 9pt"><a href=# onclick="this.document.fsearch1.search_type.value='from_user';this.document.fsearch1.keyword.value='校工会';this.document.fsearch1.dayy.value='30#一个月';this.document.fsearch1.searchb1.click();">校工会</a></td>
<td>
<a href="view.asp?id=199694" target=_blank>·<b>游泳比赛成绩公告</b></a></td>
<td align="center" style="font-size: 9pt">2010.6.26</td>
<td align="center"></td> </tr>
HTML;preg_match_all("/<a .+view.asp.+>(.+)<\/a>/isU", $text, $reg);
print_r(array_map('strip_tags',$reg[1]));Array ( [0] => ·南非世界杯赛事观看场地安排(不断更新) [1] => ·游泳比赛成绩公告 )