最近做一个网站,由于网站需要做百度排名
我希望通过抓取与同行业的这种网页
来实现百度排名
不知哪位高手能给个意见,最好是相关资料当然如果是源码小弟将十分感激

解决方案 »

  1.   

    如果你需要抓取的不是海量数据,那么你可以通过百度,google等查询连接,以及你要查询的关键词,把目标网站检索出来。然后通过检索出来的IP地址,就可以抓取到他的源码信息了。
      

  2.   

    排名的话涉及到算法。最早提出网页评分的计算方法是Google。它们提出了一个“随机冲浪”模型来描述网络用户对网页的访问行为。
     《搜索引擎与信息获取技术》,,找下这本书看下,,不清楚对你是否有用。
    需要一个bot.jar...
      

  3.   

    关于排名算法的公式其中Wj代表第j个网页的权值;lij只取0、1值,代表从网页i到网页j是否存在链接;ni代表网页i有多少个链向其它网页的链接;d代表“随机冲浪”中沿着链接访问网页的平均次数。选择合适的数值,递归的使用以上公式,即可得到理想的网页链接权值。该方法能够大幅度的提高简单检索返回结果的质量,同时能够有效的防止网页编写者对搜索引擎的欺骗。因此可以将其广泛的应用在检索器提供给用户的网页排序上,对于网页评分越高的网页,就排的越前