我想给一个域名中的所有网址进行排名,方法就是先下载若干个页面,循环检测每个页面中的所有link网址,同时累加相应pagerank值,最后输出排名,但是我不知道怎么去获取一个网页中的所有link...

解决方案 »

  1.   

    要求是把若干个网页保存在硬盘中,然后对这几个网页分析,提取link,请问还能用这个方法吗?
      

  2.   

    能不能这样实现,加载一个网页,用它初始化一个Document对象,然后再获取这个Document对象中的links?
      

  3.   

    Jquery 
    $a
    什么意思啊?
      

  4.   

    var links = document.getElementsByTagId("a");不知道LZ是不是要这样效果。
      

  5.   

    正则表达示了
    1  href="(?<Link>.*?)"
    2  (?<Protocol>\w+):\/\/(?<Domain>[\w@][\w.:@]+)\/?[\w\.?=%&=\-@/$,]*