去看希望出的"Programming Bots,Spiders,and Intelligent Agents in Microsoft Visual C++" (自动,查询和智能代理程序设计) RMB 66.0 有例子

解决方案 »

  1.   

    呵呵!我也考虑过这类程序,难在算法上
    主要可以抽象成一个二叉树的节点遍历问题
    但需要很复杂的逻辑设定,在设计时还需考虑很多其他因素,例如坏链接、镜像网站等
    资源占用的分配更是重中之重
    关键在于这个二叉树的层数不固定所以我的初步看法是提取连结时,进行语法分析,判断是否是本站或本地连结(镜像网站的判断很讨厌),如是,转入本站处理程序。(这个设计还比较简单)
    但外部连结处理则很麻烦,目前没有很好的算法,我又没法偷出百度、google的spider的源代码。呵呵!希望对你能有所帮助。