如题,最近想用c#进行搜索引擎的开发,怎么样构建一个高效的蜘蛛程序和数据库是关键……
请教各位大侠,给思路和代码都行,分不够在加!!!
请教各位大侠,给思路和代码都行,分不够在加!!!
解决方案 »
- 能否获取webbrowser中的当前页面有没有声音输出?
- MethodInfo Invoke 未将对象引用设置到对象的实例??
- 关于FileNotFoundException的问题
- 用excel对象打印遇到了一个问题,求助!
- C#中关于系统日志的记录
- [MDI]MDI程序中窗口关闭的事件
- 请问C#如何将一个EXCEL中的SHEET直接拷贝到另一个EXCEL文件的SHEET中呢?(相当的急!)
- 为什么提示要提供参数?
- 超简单的小问题,见笑了
- 大家讨论:用C#或Vb.net做网页时,当执行某“删除”操作给出提示的最优化处理方法?
- wpf中TreeView的使用方法,包括数据绑定,显示列表等
- WinForm 问题
设计思想:1、http://tieba.baidu.com/f?kz=76995609
参考源代码下载: http://www.codepub.com/software/view-software-11155.html
http://www.cnblogs.com/wbbady/archive/2008/02/18/812006.html
but,你这样会更慢,还不如直接分析返回的txt文本.
是把抓取到的html当成txt文本来分析还是加载成dom在提取所需内容,这两种方法那个效率高还真没有做过测试??不过这还得看自己写的分析方法怎么样了,合理不合理了!谁能提供个好的分析html的方法??