就是一普通的在线代理
例如:客户-->proxy-->返回客户如 :客户访问sina -->proxy -->要返回的内容就是sina的,唯一不同的sina里面路径要改成proxy的路径 
我想这样实现 :proxy 用server实现,获取流 ,然后每行检测有什么路径的,
如果这行有src 或a(超链接)就把里需的资源地址做相应 的修改
即要的效果是这样:假设server 访问路径是 http://127.0.0.1/server/proxy客户访问sina ,里面有http://i1.sinaimg.cn/cj/pc/2010-03-17/32/U3343P31T32D66931F651DT20100317074120.jpg 的图片返回客户的图片地址要改成http://127.0.0.1/server/proxy/http://i1.sinaimg.cn/cj/pc/2010-03-17/32/U3343P31T32D66931F651DT20100317074120.jpg 也就是sina的有资源地址全部改成proxy地址+sina里源有地址一些用js控制的地址可以不处理现在想要问的是:html里一般了除了src 和a  超链接表示资源 ,还有什么其它的表示资源我只过滤a 和src里地址,是否可以达到我的要求

解决方案 »

  1.   

    我也只清楚src 和a 超链接表示资源..
    过滤这二个应该能达到LZ的要求。
      

  2.   

    写得过程中,又发现一个问题
    如果某个网站 ,没有设置Content-Type里的字符集,而只是通过在 meta里设置字符
    除了取网页内容,分析meta里的charset
    有没有什么方法可以取得其字符集???