网页内的链接地址全部改成绝对地址,要求适应性强 做了个网页资源采集器,现在已能获得要采集的页面源码,但是图片等链接不可得,因为图片链接基本是相对路径,要改为绝对路径才可使用,有网上介绍使用<base>,这个方法对一个页面上同时有如src="k/band/1.gif",src="/k/band/1.gif"之类的行不通。<base>不可能同时使用网站根目录和网页当前路径。有高人指点一下。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 最理想的是使用 <base ...>如果行不通,可以部分解析为绝对路径(以协议打头的,比如:http://)完整的解析你需要:一、解析出网页的标准路径:到url最后的一个路径分隔符 “/”二、根据标准路径,解析替换所有的资源链接(href,src)1、协议开头的,不需要处理2、“/”开头的,在前面加上根路径3、“../”开头的,替换为父路径4、“./”开头的,替换为标准路径5、其它情形(相对路径),在前面加上标准路径 采集到代码后,在src="后面补权全路径 在保存下来,比如 src="http://www.sina.com/k/band/1.gif" 有时会遇到这样的地址:http://blog.csdn.net/windflow,情况复杂啊 MFC开发的行情软件界面 在动态库中连接数据库如何操作? 问一个用gdi+画渐变的问题``有没有办法使渐变过程能让人感觉到`? Ctreectrl---单击鼠标左键的选择问题 ? 100分求解难题!如何实现滚屏截图? 新装了vc6.0编译时总是出错 急求:flash2avi 关于cvCreateTrackbar的问题 GetSystemInfo()是不是获得CPU的永久且唯一的序列号 谁能告诉我网络中一个软件分发的思路 求教关于CString中FindOneOf的问题. LoadLibraryEx()加载DLL时,路径正确,但是GetLastError()返回127
一、解析出网页的标准路径:到url最后的一个路径分隔符 “/”二、根据标准路径,解析替换所有的资源链接(href,src)
1、协议开头的,不需要处理
2、“/”开头的,在前面加上根路径
3、“../”开头的,替换为父路径
4、“./”开头的,替换为标准路径
5、其它情形(相对路径),在前面加上标准路径