如何判断获取抓取网页内容的导航部分

我首先利用PHP抓取了一个网页内容
ob_start();
$ch = curl_init();
curl_setopt( $ch, CURLOPT_URL, $url );
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
$retrievedhtml=curl_exec( $ch );
ob_end_clean();
curl_close( $ch );然后我想从中提取导航部分的信息，由于抓取网页地址不固定，请问怎么判断和抓取网页导航内容比较好？
有什么好方法吗

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

你可以看一下php100里面有一章专门讲的是小偷程序，你应该能用上，讲的就是截取别人网站的某一部分。想每个做php的都有这个视频，你要是没有，留下你的QQ我给你发过去，或者邮箱。希望我的回答对你有用。
导航部分，是如何定义的？以什么字符开始，以什么字符结束？
我之前做过抓取网站名称，就是<title></title>之间的部分。两步：
1、先以<title>为分隔，把整张网页代码变成一个数组，取后面的部分；
2、再以</title>分隔，再拆分数组，取前面的部分；
最终得到<title></title>中间的部分，成功！
只有自己分析了，很多人写前端个人习惯不一样，所以导航的class也不一样，你想做一个程序就抓所有网站的导航，这个估计有点难度