已经得到一个页面的HTML,如下 
<td width="46%" class="showxuxian">区域|户型|位置</td>
                        <td width="12%" align="center" class="showxuxian">面积</td>
                        <td width="11%" align="center" class="showxuxian">楼层</td>
                        <td width="11%" align="center" class="showxuxian">售价</td>
                        <td width="13%" align="center" class="showxuxian">发布时间</td>
                        <td width="7%" align="center" class="showxuxian">详细</td>
                      </tr>
  <tr><td class='showxuxian'>[东坝区] 高层&nbsp;三室二厅二卫<br><span>广元启明星花园房屋出租</span></td><td align='center' class='showxuxian'>117 M&sup2;</td><td align='center' class='showxuxian'>1/17</td><td align='center' class='showxuxian'>800元/月</td><td align='center' class='showxuxian'>2010-9-25</td><td align='center' class='showxuxian'><a href='../Html/Rent/43717.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[东坝区] 多层&nbsp;二室二厅<br><span>苴国市场巴渝约火锅楼上</span></td><td align='center' class='showxuxian'>90 M&sup2;</td><td align='center' class='showxuxian'>3/7</td><td align='center' class='showxuxian'>500元/月</td><td align='center' class='showxuxian'>2010-11-29</td><td align='center' class='showxuxian'><a href='../Html/Rent/43828.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[南河坝] 多层&nbsp;三室二厅<br><span>陵江御园</span></td><td align='center' class='showxuxian'>138 M&sup2;</td><td align='center' class='showxuxian'>3/6</td><td align='center' class='showxuxian'>1500元/月</td><td align='center' class='showxuxian'>2010-11-29</td><td align='center' class='showxuxian'><a href='../Html/Rent/43827.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[老城区] 多层&nbsp;二室一厅<br><span>北门车站</span></td><td align='center' class='showxuxian'>62 M&sup2;</td><td align='center' class='showxuxian'>2/7</td><td align='center' class='showxuxian'>700元/月</td><td align='center' class='showxuxian'>2010-11-29</td><td align='center' class='showxuxian'><a href='../Html/Rent/43826.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[东坝区] 多层&nbsp;三室二厅二卫<br><span>翡翠城</span></td><td align='center' class='showxuxian'>117 M&sup2;</td><td align='center' class='showxuxian'>6/6</td><td align='center' class='showxuxian'>1700元/月</td><td align='center' class='showxuxian'>2010-11-28</td><td align='center' class='showxuxian'><a href='../Html/Rent/43825.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[东坝区] 多层&nbsp;三室二厅<br><span>启明星花园</span></td><td align='center' class='showxuxian'>110 M&sup2;</td><td align='center' class='showxuxian'>4/6</td><td align='center' class='showxuxian'>1700元/月</td><td align='center' class='showxuxian'>2010-11-27</td><td align='center' class='showxuxian'><a href='../Html/Rent/43824.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[东坝区] 多层&nbsp;三室二厅<br><span>081道口内116厂回首</span></td><td align='center' class='showxuxian'>140 M&sup2;</td><td align='center' class='showxuxian'>3/3</td><td align='center' class='showxuxian'>600元/月</td><td align='center' class='showxuxian'>2010-11-23</td><td align='center' class='showxuxian'><a href='../Html/Rent/43820.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[东坝区] 多层&nbsp;二室二厅<br><span>苴国市场巴渝红楼上</span></td><td align='center' class='showxuxian'>90 M&sup2;</td><td align='center' class='showxuxian'>3/7</td><td align='center' class='showxuxian'>500元/月</td><td align='center' class='showxuxian'>2010-11-22</td><td align='center' class='showxuxian'><a href='../Html/Rent/43815.htm' target='_blank'>查看</a></td></tr><tr><td class='showxuxian'>[东坝区] 多层&nbsp;三室二厅二卫<br><span>通大道附近</span></td><td align='center' class='showxuxian'>130 M&sup2;</td><td align='center' class='showxuxian'>2/5</td><td align='center' class='showxuxian'>1000元/月</td><td align='center' class='showxuxian'>2010-11-21</td><td align='center' class='showxuxian'><a href='../Html/Rent/43814.htm' target='_blank'>查看</a></td></tr>想用PREG_MATCH_ALL 提取里面的链接和文字"查看"连接为<a href='../Html/Rent/43778.htm' target='_blank'>查看</a></td></tr>我自己这样弄的,肯定不对 preg_match_all('/<a href='(.*)' target='_blank'>(.*)<\/a><\/td><\/tr>/isU',$content,$gy);谁帮我看看, 我需要得到这个HTML里的所有链接! 其中$CONTENT就是HTML吧!初学的,嘿嘿! 帮帮忙咯!

解决方案 »

  1.   

    我单独把你的HTML代码存到了一个页面当中
    然后获取内容页面代码如下
    <?php
    header("Content-type:text/html;charset=utf8");
    $content = file_get_contents('./testregular.html');
    $matchs = array();
    $matchs1 = array();
    preg_match_all ( '|\.\./Html/Rent/[\d]+.htm|', $content, $matchs);
    preg_match_all ( '|k\'>(.*)</a>|U', $content, $matchs1);
    print_r($matchs);
    echo "<hr/>";
    print_r($matchs1);
    ?>
    输出结果
    Array ( [0] => Array ( [0] => ../Html/Rent/43717.htm [1] => ../Html/Rent/43828.htm [2] => ../Html/Rent/43827.htm [3] => ../Html/Rent/43826.htm [4] => ../Html/Rent/43825.htm [5] => ../Html/Rent/43824.htm [6] => ../Html/Rent/43820.htm [7] => ../Html/Rent/43815.htm [8] => ../Html/Rent/43814.htm ) )
    Array ( [0] => Array ( [0] => k'>查看 [1] => k'>查看 [2] => k'>查看 [3] => k'>查看 [4] => k'>查看 [5] => k'>查看 [6] => k'>查看 [7] => k'>查看 [8] => k'>查看 ) [1] => Array ( [0] => 查看 [1] => 查看 [2] => 查看 [3] => 查看 [4] => 查看 [5] => 查看 [6] => 查看 [7] => 查看 [8] => 查看 ) )
    有两个数组,第一个是你要的页面的 第二个是你要的查看  其中查看的数组中 第二个子数组是你要求的匹配的,如果有问题再说
      

  2.   


    如果我想通过一个 preg_match_all 获得如此的一个数组你看如何才能实现!$matchs[1] 为 链接地址 $matchs[2] 为链接的文字.可能我太钻牛角了, 我想这样实现! :))))
      

  3.   

    <a href='../Html/Rent/43717.htm' target='_blank'>查看</a></td></tr>因为这段链接的唯一性, 我需要取这中间的链接地址, 匹配正则时 需要过滤这整段 得到地址! 才开始的意思没表达清楚!