中关村手机频道抓取文档
框架:.Net FrameWork
编程语言:Csharp两个模块:抓取,保存抓取:手机品牌以及手机型号列表
1. 分析网页,编写正则表达式
2. 编写对象来存储正则表达式组所捕获的数据
3. 返回对象
保存: 手机品牌以及手机型号列表
(一) 设计数据库中逻辑关系
(二) 判断数据库是否存在此条记录在某个分类中,如果不存在那么保存到数据库中!程序设计:
常量,对象,方法集1.常量大致分为3个部分:正则表达式,自定义错误信息,数据库库中的表名(Enum)
2.对象:用于接收采集的数据
3.编码转义,返回错误对象,操作数据库
这份文档应该怎么改写???