爬虫是怎么实现的? 用什么写的

解决方案 »

  1.   

    怎么获取不是问题,发请求获取服务器返回数据之后不过是一些字符串操作。问题在于怎么高效率地获取,储存和查询。
      

  2.   


    高性能开发是个任务艰巨的问题
      

  3.   

    爬虫可以用C,C++写。爬虫把爬到的网页以一种高效的方式存储。当用户输入软件字,就在爬到的网页里面检索。将结果展现给用户。存储,检索,性能是难点。
      

  4.   

    不是这么简单的把。搜索引擎主要是如何合理的分词和匹配,以及检索,存储。
      

  5.   

    自动生成域名访问,有页面则爬出去,没有则到第二个
    另外,根据页面中内容,根据一定规则获取内容