谁有爬虫程序开发经验? 名称 address tel link 武汉火车站 湖北省武汉市.... 123456 http://www.wh.cn 只搜与这几个名称相关的网页并取出来显示成一个列表 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 要自动分析结果,取出正确答案,那基本没戏如果只是取得GOOGLE或百度的搜索结果,基本就是写几个合适的正则就能搞定了 1:蜘蛛程序仅仅只是收集网页,只是一个downloader;2:对文本进行分析的是SE的分析引擎,其中包括了HTML格式化等语言处理程序,分析后形成索引;3:搜索则是搜索引擎SE来做,通过对搜索结果进行评分决定相关性排序的顺序,显示给用户;泛化意义上的搜索引擎是这几个组件的综合体有些蜘蛛喜欢在采集同时进行分析,但纯粹意义上的蜘蛛只做很简单的工作的LZ你想要的是一整套SE,要采集然后分析的如果只是对GOOGLE、BAIDU进行聚合,那么搞几个正则,分析GOOGLE、BAIDU的返回内容就可以了 webrequest等获取数据,再用正则获取相关值参考参考 c#中设置用户名登录界面的enter键自动登录的功能 用方法名调用方法 关于捕捉USB摄像头突然断开的消息,又如何捕获在其重插后的消息? 谁能给我 手机号码归属地的数据文件啊 要.txt的 怎样获得服务器端的文件 <求助> Visual C# + fastReport 3.19 打印数据库图片的困惑... 求教!关于类型化DataSet 指针 visual 2010中装了sql2005 express 添加数据库出错 asp.net 弹出确认消息框 关于两个winform间的传值,急啊做毕业设计 修改用户密码的代码!~谁帮我改改 ,连接的是ACCESS数据库,在线啊
如果只是取得GOOGLE或百度的搜索结果,基本就是写几个合适的正则就能搞定了
2:对文本进行分析的是SE的分析引擎,其中包括了HTML格式化等语言处理程序,分析后形成索引;
3:搜索则是搜索引擎SE来做,通过对搜索结果进行评分决定相关性排序的顺序,显示给用户;泛化意义上的搜索引擎是这几个组件的综合体有些蜘蛛喜欢在采集同时进行分析,但纯粹意义上的蜘蛛只做很简单的工作的LZ你想要的是一整套SE,要采集然后分析的如果只是对GOOGLE、BAIDU进行聚合,那么搞几个正则,分析GOOGLE、BAIDU的返回内容就可以了
参考
参考