如何抓取其他网页中的新商品,比如有新商品字样的最新发布的物品就抓取下来,而其他的就不要了,类似这种。如何用PHP来实现?急求高手指点!!

解决方案 »

  1.   

    curl  +正则
    不清楚楼主要抓什么内容  商品的所有详细?
      

  2.   

    这个不好说   看什么站了 我有同学做过java抓的    不难 难在你的新旧是怎么区分的啊
      

  3.   

    Curl抓取网页
    网站上有RSS吗?如果有解析XML获取数据再进行数据库操作就OK了,
    如果没有,就需要解析HTML,有个叫simpleHTML的类可以试试,再者就通过正则表达式匹配