如题,,我想抓取一个网站上部分显示的数据(时时更新的),我查了一下说是要用正则表达式,
       那个大侠能给我说下怎么抓取的(最好有例子)高分报答!

解决方案 »

  1.   

    如果网页内容很有规律的话,就没必要用正则表达式,一般的字符串分析就好了。如果内容很乱而且很多,就最好用正则表达式。
    如果你不熟悉正则表达式的话,建议还是要去学一学,正则表达式分析这些没有规律网页内容还是效率很高的,而且编程简单。给你一些正则表达式的学习资料:http://hi.csdn.net/link.php?url=http://blog.csdn.net%2Fzhiqiangzhan
    http://unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm
      

  2.   

    推荐一个软件给你:RegexBuddy3超级好用,玩正则有了它,真是无比快乐啊先声明,这不是广告,我也开发不出那么牛b的软件
      

  3.   

    看看这些例子:
    http://topic.csdn.net/u/20090804/07/31f0bb72-461a-4bef-b1df-fb4abc9d84fa.html
    http://topic.csdn.net/u/20090806/17/476dd849-9805-4fb2-a6e1-ae2578833664.html
    http://topic.csdn.net/u/20090617/15/184f730a-419d-4fe0-b9f2-8728f698dad1.html
    http://topic.csdn.net/u/20090707/09/cbf2d718-02bf-4fdb-9fa3-6aff96c83d63.html
    http://topic.csdn.net/u/20090616/16/4c9c4d4b-c54e-42b4-a102-aeddd2b64d1c.html (不过PilotEdit现在已经不免费发送序列号了)
      

  4.   

    file_get_contents获取网页数据,
    对获取的数据进行正则操作
    完成
    你需要了解的是正则表达式的知识.
      

  5.   

    PHP100教程里的 第16课讲的 就是 利用 正则表达式 实现小偷程序 获取别的网站 数据你看看吧http://www.php100.com/html/shipinjiaocheng/PHP100shipinjiaocheng/2009/0416/810.html1、初识正则表达式
       ^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+
       用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。2、正则表达式函数 ereg() eregi()
       ereg(正则表达式, 内容, 返回的数组);
       若省略参数返回的数组,找到则返回值为 True 否则 返回 False
       ereg() 有区分大小写,eregi() 无区分大小写3、file_get_contents 读取整个文件函数4、写一个天气预报小偷的程序
      

  6.   

    $url = "http://www.php100.com"; 
    $fcontents = file_get_contents($url);
    preg_match('/<!DOCTYPE html PUBLIC \"-\/\/W3C\/\/DTD XHTML 1.0 Transitional\/\/EN\" \"http:\/\/www\.w3\.org\/TR\/xhtml1\/DTD\/xhtml1-transitional\.dtd\">(.*)<script src=\"http:\/\/s7\.cnzz\.com\/stat\.php\?id=1668579&web_id=1668579\" language=\"JavaScript\" charset=\"gb2312\"><\/script>/is',$fcontents, $regs);
    var_dump($regs[0]);