正则表达式抓取数据 如题,,我想抓取一个网站上部分显示的数据(时时更新的),我查了一下说是要用正则表达式, 那个大侠能给我说下怎么抓取的(最好有例子)高分报答! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 如果网页内容很有规律的话,就没必要用正则表达式,一般的字符串分析就好了。如果内容很乱而且很多,就最好用正则表达式。如果你不熟悉正则表达式的话,建议还是要去学一学,正则表达式分析这些没有规律网页内容还是效率很高的,而且编程简单。给你一些正则表达式的学习资料:http://hi.csdn.net/link.php?url=http://blog.csdn.net%2Fzhiqiangzhanhttp://unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm 推荐一个软件给你:RegexBuddy3超级好用,玩正则有了它,真是无比快乐啊先声明,这不是广告,我也开发不出那么牛b的软件 看看这些例子:http://topic.csdn.net/u/20090804/07/31f0bb72-461a-4bef-b1df-fb4abc9d84fa.htmlhttp://topic.csdn.net/u/20090806/17/476dd849-9805-4fb2-a6e1-ae2578833664.htmlhttp://topic.csdn.net/u/20090617/15/184f730a-419d-4fe0-b9f2-8728f698dad1.htmlhttp://topic.csdn.net/u/20090707/09/cbf2d718-02bf-4fdb-9fa3-6aff96c83d63.htmlhttp://topic.csdn.net/u/20090616/16/4c9c4d4b-c54e-42b4-a102-aeddd2b64d1c.html (不过PilotEdit现在已经不免费发送序列号了) file_get_contents获取网页数据,对获取的数据进行正则操作完成你需要了解的是正则表达式的知识. PHP100教程里的 第16课讲的 就是 利用 正则表达式 实现小偷程序 获取别的网站 数据你看看吧http://www.php100.com/html/shipinjiaocheng/PHP100shipinjiaocheng/2009/0416/810.html1、初识正则表达式 ^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+ 用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。2、正则表达式函数 ereg() eregi() ereg(正则表达式, 内容, 返回的数组); 若省略参数返回的数组,找到则返回值为 True 否则 返回 False ereg() 有区分大小写,eregi() 无区分大小写3、file_get_contents 读取整个文件函数4、写一个天气预报小偷的程序 $url = "http://www.php100.com"; $fcontents = file_get_contents($url);preg_match('/<!DOCTYPE html PUBLIC \"-\/\/W3C\/\/DTD XHTML 1.0 Transitional\/\/EN\" \"http:\/\/www\.w3\.org\/TR\/xhtml1\/DTD\/xhtml1-transitional\.dtd\">(.*)<script src=\"http:\/\/s7\.cnzz\.com\/stat\.php\?id=1668579&web_id=1668579\" language=\"JavaScript\" charset=\"gb2312\"><\/script>/is',$fcontents, $regs);var_dump($regs[0]); 在MYSQL中如何保存汉字。。。 php程序乱码问题 有谁知道ecshop 中,后台的会员等级的模块对其他模块的影响吗? 初学PHP 想问下下面代码表达什么? 要怎么做站内搜索引擎呀,还有比如怎么得出相关问题? 一个数据转换的问题,紧急,请各位大哥帮帮忙!!!!!!!!!! php加载php_oci8 如何用php做一个对文章进行全文搜索的程序 有人试过不用表单POST数据吗? 下面这段怎么理解 eclipse+phpeclipse插件中,如何一个调整代码着色的问题 请教这个select语句如何修改
如果你不熟悉正则表达式的话,建议还是要去学一学,正则表达式分析这些没有规律网页内容还是效率很高的,而且编程简单。给你一些正则表达式的学习资料:http://hi.csdn.net/link.php?url=http://blog.csdn.net%2Fzhiqiangzhan
http://unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm
http://topic.csdn.net/u/20090804/07/31f0bb72-461a-4bef-b1df-fb4abc9d84fa.html
http://topic.csdn.net/u/20090806/17/476dd849-9805-4fb2-a6e1-ae2578833664.html
http://topic.csdn.net/u/20090617/15/184f730a-419d-4fe0-b9f2-8728f698dad1.html
http://topic.csdn.net/u/20090707/09/cbf2d718-02bf-4fdb-9fa3-6aff96c83d63.html
http://topic.csdn.net/u/20090616/16/4c9c4d4b-c54e-42b4-a102-aeddd2b64d1c.html (不过PilotEdit现在已经不免费发送序列号了)
对获取的数据进行正则操作
完成
你需要了解的是正则表达式的知识.
^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+
用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。2、正则表达式函数 ereg() eregi()
ereg(正则表达式, 内容, 返回的数组);
若省略参数返回的数组,找到则返回值为 True 否则 返回 False
ereg() 有区分大小写,eregi() 无区分大小写3、file_get_contents 读取整个文件函数4、写一个天气预报小偷的程序
$fcontents = file_get_contents($url);
preg_match('/<!DOCTYPE html PUBLIC \"-\/\/W3C\/\/DTD XHTML 1.0 Transitional\/\/EN\" \"http:\/\/www\.w3\.org\/TR\/xhtml1\/DTD\/xhtml1-transitional\.dtd\">(.*)<script src=\"http:\/\/s7\.cnzz\.com\/stat\.php\?id=1668579&web_id=1668579\" language=\"JavaScript\" charset=\"gb2312\"><\/script>/is',$fcontents, $regs);
var_dump($regs[0]);