我首先利用PHP抓取了一个网页内容
ob_start();  
$ch = curl_init();  
curl_setopt( $ch, CURLOPT_URL, $url );
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
$retrievedhtml=curl_exec( $ch );  
ob_end_clean();  
curl_close( $ch );然后我想从中提取导航部分的信息,由于抓取网页地址不固定,请问怎么判断和抓取网页导航内容比较好?
有什么好方法吗

解决方案 »

  1.   

    你可以看一下php100里面有一章专门讲的是小偷程序,你应该能用上,讲的就是截取别人网站的某一部分。想每个做php的都有这个视频,你要是没有,留下你的QQ我给你发过去,或者邮箱。希望我的回答对你有用。
      

  2.   

    导航部分,是如何定义的?以什么字符开始,以什么字符结束?
    我之前做过抓取网站名称,就是<title></title>之间的部分。两步:
    1、先以<title>为分隔,把整张网页代码变成一个数组,取后面的部分;
    2、再以</title>分隔,再拆分数组,取前面的部分;
    最终得到<title></title>中间的部分,成功!
      

  3.   

    只有自己分析了,很多人写前端个人习惯不一样,所以导航的class也不一样,你想做一个程序就抓所有网站的导航,这个估计有点难度