我有网页源代码,想要获得其中RSS的链接:
网页源代码中有
<html>
...
<link rel="alternate" type="application/rss+xml" title="新华网国内新闻"
href="http://rss.xinhuanet.com/rss/native.xml" />
...
</html>
我想要获得http://rss.xinhuanet.com/rss/native.xml,正则和php代码应该怎么写呢。。
需要考虑以下情况:

解决方案 »

  1.   

    呃。。按回车直接发布了。。
    <link rel="alternate" type="application/rss+xml" title="新华网国内新闻" href="http://rss.xinhuanet.com/rss/native.xml" />
    <link type="application/rss+xml" rel="alternate" href="http://rss.xinhuanet.com/rss/native.xml" />
    <link type=application/rss+xml rel=alternate href=http://rss.xinhuanet.com/rss/native.xml />
    我看了一下午正则,但是还是写不出来这么复杂的,不知道谁会呢?谢谢大家~
      

  2.   

    preg_match_all("/<link.*?type=\"?application\/rss\+xml\"?.*?href=\"?([^\s\"]+)/",$str,$matches);
    var_dump(array_unique($matches[1]));
    //http://rss.xinhuanet.com/rss/native.xml
      

  3.   

    (?<=<link[^>]*?)(?<=\shref=\"?)[^"]*?(?=\s|\"|/>)