<div class="pack pack_album">
<div class="pic">
<a href="http://www.tudou.com/playlist/album/id68974.html" target="_blank"><img src="http://at-img2.tdimg.com/board/album/2011/11-04/1320392614688.jpg" height="182" width="132"></a>

<span class="vpbg"></span>
<a class="vinf" target="_blank" href="http://www.tudou.com/playlist/album/id68974.html">全15集</a>
</div>


<div class="txt">
<h6 class="caption">
<a href="http://www.tudou.com/playlist/album/id68974.html" title="似火骄阳" target="_blank">似火骄阳</a></h6><ul class="info"><li class="desc">骄傲的火焰,傲慢的火</li><li class="cast">
<a href="http://www.tudou.com/albumtop/person/m53654-c0-p1.html" target="_blank">Maria</a></li></ul>
</div>


<div class="ext">

<div class="ext_txt">
<h3 class="ext_title">似火骄阳</h3>
<div class="ext_info">
<span class="ext_area">地区: 泰国</span>
<span class="ext_cast">导演: <a href="http://www.tudou.com/albumtop/person/m65203-c0-p1.html" target="_blank">不详</a></span>
<span class="ext_date">年代: 2011</span>
<span class="ext_type">类型: 剧情/爱情/偶像</span>
</div>
<p class="ext_intro">Arm是篮球队的璀璨明星,女孩们的梦中情人,学校的风云人物。 Muk则是一位学习优异的千金小姐,美丽优雅,喜欢在图书馆流连。一个,...</p>

<div class="ext_dig">389</div>

<span class="ext_arrow"></span>
</div>
</div></div>
这样一段html代码,希望得到, 下面几个字符似火骄阳www.tudou.com/playlist/album/id68974.html就是想得到上面两段字符,还请指点一下。

解决方案 »

  1.   

    preg_match('/<h6[^>]*>\s*<a href="([^"<>]+)"[^>]*>(.*)<\/a>\s*<\/h6>/isuU',$html,$matchs);
    print_r($matchs);
      

  2.   

    也就是说,得到这个连接的标题 和连接的href<div class="txt">
    <h6 class="caption">
    <a href="http://www.tudou.com/playlist/album/id68974.html" title="似火骄阳" target="_blank">似火骄阳</a></h6><ul class="info"><li class="desc">骄傲的火焰,傲慢的火</li><li class="cast">
    <a href="http://www.tudou.com/albumtop/person/m53654-c0-p1.html" target="_blank">Maria</a></li></ul>
    </div>匹配这一段应该就有结果,
    全发出来只是怕你的题义没有说清楚
      

  3.   


    $pattern = '~caption.*?href="(.*?)"[^>]*?>([^<]*?)<~is';
    preg_match_all($pattern, $str, $matches);
    echo '<pre>';
    print_r($matches);
    echo '</pre>';
    /**
    Array
    (
        [0] => Array
            (
                [0] => caption">
    <a href="http://www.tudou.com/playlist/album/id68974.html" title="似火骄阳" target="_blank">似火骄阳<
            )    [1] => Array
            (
                [0] => http://www.tudou.com/playlist/album/id68974.html
            )    [2] => Array
            (
                [0] => 似火骄阳
            ))
    */
      

  4.   


    你的这条语句不行给我去掉了 isuU 才可以的
      

  5.   

    哦,那可能用的不是utf-8的编码,可以保留isU;
    为了匹配的准确性,可以将整段转成utf-8,在用isuU匹配