大家好,我在使用工具抓取网页时遇到了问题:我要抓取的网页中包含下面的代码片段<div class="jsmenu" id="searchmenu">
<ul>
<li id="1_1" class="">
<a href="javascript:ChangeTab('quick',1);SubmitTab('','SCAB','quick','',1);" title="AAA">search</a>
</li>
<li id ="1_2" class="active">
<a href="javascript:ChangeTab('normol',2);SubmitTab('','SCAB','normol','',2);" title="BBB">standar</a>
</li>
<li id="1_3" class ="">
<a href="javascript:ChangeTab('special',3);SubmitTab('','SCAB','special','',3);" title="CCC">special</a>
</li>
</ul>... ... ....
我尝试了很多工具,诸如 TeleportUltra 、Offline_Explorer_Enterprise 等 都无法下载<a href="javascript:ChangeTab 对应的链接页面,这些工具似乎都不会 解析 <a href="javascript:ChangeTab 的内容然后打开并下载这些页面。还有其他什么工具可以用吗,或者编程的思路也行。希望大家能指点指点我,先谢谢各位了。另外,我的目标是 抓取 http URL 对应页面的所有内容,包括 css,js,images等,还要 上面提到的 <a href="javascript:ChangeTab里面的内容,也就是整个页面的镜像 ,full page
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货