我正在做一个价格比较网,在数据库设计上遇到了难题:
例:1、有n1(>10+)个商品大类,而且不断增加中,每个大类都有N(>=1)个商品,
2、现在打算从n3(<100)网站采集每个商品的价格数据,价格分为平邮价格和快递价格两种(如何采集大家不用考虑)
3、每隔一小时对所有网站的所有商品采集一次,要入库,因为要做比较
实现功能: 1、当前价格和昨日均价的比较(上升或者下降)
2、一个商品各个网站的横向比较这个数据库该如何设计,谢谢大家了
我原先的想法是: 商品一个表,通过parentid来区分是大类还是商品;
网站一个表,记录了网站的相关信息;
每个大类一个表: 5个字段:网站id 商品id 平邮价格 快递价格 日期这个是我目前能想到的比较好的方法了:最大的疑虑就是:每天采集24次,有100+甚至更多的商品,然后还有10+以上的网站采集,这样下来,一天的记录就有:24*100*10=2.4w条记录 庞大的很,该何如设计才能减少记录数;
附:前一天每一个网站的同一个商品的的23条记录可以取平均值保存为一条记录,可是我不知道如何实现,谢谢了大家都来像个法子,谢谢了
例:1、有n1(>10+)个商品大类,而且不断增加中,每个大类都有N(>=1)个商品,
2、现在打算从n3(<100)网站采集每个商品的价格数据,价格分为平邮价格和快递价格两种(如何采集大家不用考虑)
3、每隔一小时对所有网站的所有商品采集一次,要入库,因为要做比较
实现功能: 1、当前价格和昨日均价的比较(上升或者下降)
2、一个商品各个网站的横向比较这个数据库该如何设计,谢谢大家了
我原先的想法是: 商品一个表,通过parentid来区分是大类还是商品;
网站一个表,记录了网站的相关信息;
每个大类一个表: 5个字段:网站id 商品id 平邮价格 快递价格 日期这个是我目前能想到的比较好的方法了:最大的疑虑就是:每天采集24次,有100+甚至更多的商品,然后还有10+以上的网站采集,这样下来,一天的记录就有:24*100*10=2.4w条记录 庞大的很,该何如设计才能减少记录数;
附:前一天每一个网站的同一个商品的的23条记录可以取平均值保存为一条记录,可是我不知道如何实现,谢谢了大家都来像个法子,谢谢了
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货