比如: 我用heritrix抓取了jsp文件,抓取下的文件名如下:
show_hotelshopid=102&catid=2.jsp
我做搜索引擎开发,希望通过抓下来的文件名拼成一个url指向原网页
可拼出来的url是http://xxx.xxx.show_hotelshopid=102&catid=2.jsp
但实际想要的url是http://xxx.xxx.show_hotel.jsp?shopid=102&catid=2
如何将这个url改回来??得到正确的url??
show_hotelshopid=102&catid=2.jsp
我做搜索引擎开发,希望通过抓下来的文件名拼成一个url指向原网页
可拼出来的url是http://xxx.xxx.show_hotelshopid=102&catid=2.jsp
但实际想要的url是http://xxx.xxx.show_hotel.jsp?shopid=102&catid=2
如何将这个url改回来??得到正确的url??
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货