最近正修改一个采集多媒体的程序。采集程序是根据url来解析的。采集视频就是解析url最后的视频格式(wmv,rm,avi等)
在采集视频时出现了以下问题。
例如:当采集http://xxxxx/share/wmv/zdhssq50.wmv 以wmv,rm,avi等常用视频格式结尾时不会出现问题。
但是现在网站上的视频大多隐去实际的url。
例如:http://v.blog.sohu.com/u/vw/1720981是搜狐上的一段视频,采集这样url的视频时就采集不到视频。
怎样才能获取这类网站的以wmv,rm,avi等常用格式结尾的真实url。谢谢!

解决方案 »

  1.   

    有人建议“这个是通过一定的规则重写了url,你可以尝试去看看恢复成url的样子”,
    可我还是云里雾里,貌似一个很难的问题。
      

  2.   

    URL被改写了,除非你知道改写的规则否则你找不到改前的URL 一般都是用正则表达式来限定规则的
      

  3.   

    即便是知道了改写规则,我的采集程序也没办法用来解析用一定规则的正则表达式改写的url。
      

  4.   

    求问楼主找到方法了么?
    我现在要写一个读取网页中视频的信息 比如时长  的程序 但是根本就没思路啊
    直接查看源码的话基本上什么信息都获取不到  必须等整个页面加载完毕了才能获取信息  firebug等插件可以实现 但是java怎么调用不知道啊