请教 网址为:http://www.5ccc.net/wksz_topmonthvisit/0/1.html
想匹配小说列表也就是 <div id="content"> 到 </table> 之间的部分,奇怪的是用下面的方法匹配不到任何东西
preg_match('#<div\s*id=\"content\">(.+?)<\/table>#',$text,$arr);甚至这个也匹配不到东西
preg_match('#斗破苍穹(.+?)凡人修仙传#',$text,$arr);请问是有防采还是什么?下面为部分网页代码,求解谢谢<div class="block">
<div class="blocktitle">排 行 榜</div>
<div class="blockcontent"><ul class="ulcenter"> <li><a href="/wksz_topallvisit/0/1.html">总排行榜</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="/wksz_topallvote/0/1.html">总推荐榜</a></li> <li><a href="/wksz_topmonthvisit/0/1.html">月排行榜</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="/wksz_topmonthvote/0/1.html">月推荐榜</a></li> <li><a href="/wksz_topweekvisit/0/1.html">周排行榜</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="/wksz_topweekvote/0/1.html">周推荐榜</a></li> <li><a href="/wksz_toppostdate/0/1.html">最新入库</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="/wksz_toplastupdate/0/1.html">最近更新</a></li> <li><a href="/wksz_topauthorupdate/0/1.html">原创更新</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="/wksz_topmasterupdate/0/1.html">转载更新</a></li> <li><a href="/wksz_topgoodnum/0/1.html">总收藏榜</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="/wksz_topsize/0/1.html">字数排行</a></li> </ul></div> </div>
  
</div>
  <div id="centerm">
<div id="content"><table class="grid" width="100%" align="center"> <caption>月排行榜</caption> <tr align="center"> <th width="14%">文章名称</th> <th>最新章节</th> <th width="12%">作者</th> <!--
    <th width="5%">推荐</th> <th width="9%">点击</th>
--> <th width="9%">字数</th> <th width="10%">更新</th> <th width="6%">状态</th> </tr>
  
  <tr> <td class="odd"><a href="http://www.5ccc.net/wksz_info/25/25854.html">斗破苍穹</a></td> <td class="even"><a href="http://admin.5ccc.net/modules/article/reader.php?aid=25854&cid=3994149" target="_blank">第一千四百三十章 天府联盟</a></td> <td class="odd">天蚕土豆</td> <!--
    <td class="even" align="center">2362451</td> <td class="odd" align="center">4870130</td>
--> <td class="even">3101K</td> <td class="odd" align="center">11-04-16</td> <td class="even" align="center">连载</td> </tr>
  
  <tr> <td class="odd"><a href="http://www.5ccc.net/wksz_info/19/19030.html">凡人修仙传</a></td> <td class="even"><a href="http://admin.5ccc.net/modules/article/reader.php?aid=19030&cid=3994217" target="_blank">第一千七百二十二章 银尺与金身</a></td> <td class="odd">忘语</td> <!--
    <td class="even" align="center">1509470</td> <td class="odd" align="center">1861328</td>
--> <td class="even">3515K</td> <td class="odd" align="center">11-04-17</td> <td class="even" align="center">连载</td> </tr>
  
  <tr> <td class="odd"><a href="http://www.5ccc.net/wksz_info/29/29865.html">吞噬星空</a></td> <td class="even"><a href="http://admin.5ccc.net/modules/article/reader.php?aid=29865&cid=3992419" target="_blank">第九篇 第五十八章 雨刀门恒星</a></td> <td class="odd">我吃西红柿</td> <!--
    <td class="even" align="center">472354</td> <td class="odd" align="center">976413</td>
--> <td class="even">1807K</td> <td class="odd" align="center">11-04-13</td> <td class="even" align="center">连载</td> </tr>
  
………………………………………………
  <tr> <td class="odd"><a href="http://www.5ccc.net/wksz_info/29/29429.html">星际游轮</a></td> <td class="even"><a href="http://admin.5ccc.net/modules/article/reader.php?aid=29429&cid=3994330" target="_blank">第1195章 困局</a></td> <td class="odd">古剑锋</td> <!--
    <td class="even" align="center">74380</td> <td class="odd" align="center">1279705</td>
--> <td class="even">1569K</td> <td class="odd" align="center">11-04-17</td> <td class="even" align="center">连载</td> </tr>
  
</table> <table width="100%"  border="0" cellspacing="2" cellpadding="3"> <tr> <td align="right"><div class="pagelink" id="pagelink"><em id="pagestats">1/485</em><a href="http://www.5ccc.net/wksz_topmonthvisit/0/1.html" class="first">1</a><a href="http://www.5ccc.net/wksz_topmonthvisit/0/1.html" class="pgroup">&lt;&lt;</a><strong>1</strong><a href="http://www.5ccc.net/wksz_topmonthvisit/0/2.html">2</a><a href="http://www.5ccc.net/wksz_topmonthvisit/0/3.html">3</a><a href="http://www.5ccc.net/wksz_topmonthvisit/0/4.html">4</a><a href="http://www.5ccc.net/wksz_topmonthvisit/0/5.html">5</a><a 

解决方案 »

  1.   


    应该是ims,或者(.+?)改为((?:.|\s)+?)preg_match('#<div\s*id=\"content\">(.+?)<\/table>#ims',$html,$arr);orpreg_match('#<div\s*id=\"content\">((?:.|\s)+?)<\/table>#im',$html,$arr);
      

  2.   

    simple_html_dom.php 下载地址<?php
    header('Content-type:text/html; charset=gbk');
    require_once 'simple_html_dom.php';
    $v = 'http://www.5ccc.net/wksz_topmonthvisit/0/1.html';
    $html = file_get_html($v);
    foreach($html->find('#content') as $element) {
    echo $element;
    }
    ?>