我看到很多站群软件,输入关键字就能采集网页,也不需要写规则,我很好奇,数据是从哪里来的,采集的哪里,不可能像搜索引擎一样吧,是在很好奇,求高人解答
解决方案 »
- 怎么制作自己的GOOGLE地图
- 求帮助:如何判断var为空
- 如何在asp.net中实现在登录的时候有记住用户名和密码的功能?
- microsoft为简化多线程做了那些工作
- 在线等!急!treeview问题?
- DropDownList 的选择for语句怎么写
- 谁知道vs.net2005中文版什么时候出呀??
- ASP.NET实现个人登录
- 求:dsoframer.ocx那有下的,可以提供完整的地址吗?还有怎么用,给个简单的例子,谢谢!在线等!!谢谢!
- !高分求助 asp.net项目迁移的问题
- WebClient.UploadStringAsync(Uri, String, String, Object) 中的object是怎么用的?救解……
- 谁有好点的aspx 用户管理模块分享?
我也觉得不是这样,"分析里面的URL,再获取URL的内容,再分析HTML的内容",再分析HTML的内容的时候,url不同,HTML的格式也不同,这时候怎么分析呢?
比如提交到百度,分析里面的url 得到a.com和b.com两个url,在获取a.com的网页内容和b.com的网页内容,这时候a.com和b.com的html内容相差很大,怎么分析呢?