php如何抓取网页中的数据? 可用curl 或 file_get_contents会读取目标网站的html代码 然后你要自己根据他的代码来写正则提取出你想要的没有具体的网页不太好给例子 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 还是不太明白啊!刚开始学,能不能解释详细点啊? 比如说我要抓取下边这个网页中的数据,但是我只要“英语”"韩语"“德语”这三个词,请问用php编程怎么写啊?===================================================================================--> <div id="Div3" class="modResumeInfo"> <div class="title" onclick="clickLabel(rsmEduExCt)"> <div class="dcrL dcrArrowGreen"></div> <h3>外语能力</h3> </div> <div id="Div4" class="content"> <div class="workExCom">英语:读写能力精通 | 听说能力熟练</div> <div class="workExCom">韩语:读写能力一般 | 听说能力良好</div> <div class="workExCom">德语:读写能力一般 | 听说能力一般</div> </div> </div><!--modResumeInfo结束--> <!--=====================================================================================--> http://www.111cn.net/phper/21/33113.htm <?php $str = '<div id="Div3" class="modResumeInfo"><div class="title" onclick="clickLabel(rsmEduExCt)"><div class="dcrL dcrArrowGreen"></div><h3>外语能力</h3></div><div id="Div4" class="content"> <div class="workExCom">英语:读写能力精通 | 听说能力熟练</div><div class="workExCom">韩语:读写能力一般 | 听说能力良好</div><div class="workExCom">德语:读写能力一般 | 听说能力一般</div></div> </div><!--modResumeInfo结束--><!--=====================================================================================-->';preg_match_all('/<div class="workExCom">(.*):/',$str,$arr);print_r($arr[1]);?>我正则也不好 大概就是这样 可不可以给个具体点儿的啊!说的这么简单,还是不明白!对php这方面基本上是一窍不通啊‘能不能把用到的关于curl的代码写给俺看看!不胜感激!!!!!!!!!!还有这个curl+正则可以直接用到火车头采集器的接口插件中把? </div><div id="Div4" class="content"> <div class="workExCom">英语:读写能力精通 | 听说能力熟练</div><div class="workExCom">韩语:读写能力一般 | 听说能力良好</div><div class="workExCom">德语:读写能力一般 | 听说能力一般</div></div> 我想取出英语 韩语 德语这三个词,用正则表达是怎么写?用这种格式:前字符串(?<content>[\s\S]*?)后字符串 我记得你,之前问过火车头的。其实这段代码火车头可以截取的,当然,你利用crul+正则也可以,正则的参考4楼就可以了,不过好像<,"这些字符要转义的,自己多试试吧,输出来看看就知道了 http://www.php100.com/html/shipinjiaocheng/PHP100shipinjiaocheng/2010/0621/4795.htmlhttp://www.php100.com/html/shipinjiaocheng/PHP100shipinjiaocheng/2010/0628/4848.html这里有两个curl的视频教程,希望对你能有所帮助! CURL,百度一下,资料用法很多,正则就和PHP没傻关系了,任何语言都有!我建议楼主可以自己多研究下,自己研究获得的东西一辈子都受用,而且还能提高自我解决问题的能力,如果在实际操作中遇到什么代码故障,再发帖出来讨论,这样更符合一个学者的精神!仅供参考,我多嘴了。呵呵! 读取远程的url然后用正则匹配得到结果你可以存到数据库,或者文件中 一般都是Curl+正则,目前我在用java的一个开源的程序,楼主可以参考。我的blog有关于这个使用的,是抓取火影忍者漫画的。http://web-harvest.sourceforge.net/index.php 去PHP100的网站看看教程吧! 真的假的?1块钱!!云计算真便宜到这个地步了么 linux 301l重定向问题 购物车问题 改造一段域名正则表达式 php传递php语句的问题 除了文件夹权限问题外,php程序的哪些问题会导致页面500错误? thinkphp中URL重写时的分页问题 求 数据库的update语句问题 smarty报错yntax error: unrecognized tag 子版块中如何加入嵌入点 php能不能读PDF,就像读记事本一样的操作 discuz置顶出现如下代码
===================================================================================--> <div id="Div3" class="modResumeInfo">
<div class="title" onclick="clickLabel(rsmEduExCt)">
<div class="dcrL dcrArrowGreen"></div>
<h3>外语能力</h3>
</div>
<div id="Div4" class="content">
<div class="workExCom">英语:读写能力精通 | 听说能力熟练</div>
<div class="workExCom">韩语:读写能力一般 | 听说能力良好</div>
<div class="workExCom">德语:读写能力一般 | 听说能力一般</div>
</div>
</div><!--modResumeInfo结束-->
<!--=====================================================================================-->
<?php
$str = '<div id="Div3" class="modResumeInfo">
<div class="title" onclick="clickLabel(rsmEduExCt)">
<div class="dcrL dcrArrowGreen"></div>
<h3>外语能力</h3>
</div>
<div id="Div4" class="content">
<div class="workExCom">英语:读写能力精通 | 听说能力熟练</div><div class="workExCom">韩语:读写能力一般 | 听说能力良好</div><div class="workExCom">德语:读写能力一般 | 听说能力一般</div></div>
</div><!--modResumeInfo结束--><!--=====================================================================================-->';
preg_match_all('/<div class="workExCom">(.*):/',$str,$arr);
print_r($arr[1]);
?>
我正则也不好 大概就是这样
能不能把用到的关于curl的代码写给俺看看!不胜感激!!!!!!!!!!
还有这个curl+正则可以直接用到火车头采集器的接口插件中把?
<div id="Div4" class="content">
<div class="workExCom">英语:读写能力精通 | 听说能力熟练</div><div class="workExCom">韩语:读写能力一般 | 听说能力良好</div><div class="workExCom">德语:读写能力一般 | 听说能力一般</div></div>
我想取出英语 韩语 德语这三个词,用正则表达是怎么写?
用这种格式:
前字符串(?<content>[\s\S]*?)后字符串
http://www.php100.com/html/shipinjiaocheng/PHP100shipinjiaocheng/2010/0621/4795.htmlhttp://www.php100.com/html/shipinjiaocheng/PHP100shipinjiaocheng/2010/0628/4848.html这里有两个curl的视频教程,希望对你能有所帮助!
我建议楼主可以自己多研究下,自己研究获得的东西一辈子都受用,而且还能提高自我解决问题的能力,如果在实际操作中遇到什么代码故障,再发帖出来讨论,这样更符合一个学者的精神!仅供参考,我多嘴了。呵呵!
然后用正则匹配
得到结果
你可以存到数据库,或者文件中
我的blog有关于这个使用的,是抓取火影忍者漫画的。
http://web-harvest.sourceforge.net/index.php
PHP100的网站看看教程吧!