接到一个任务,客户想做一个购物比较网站。大概的描述:
1、访客在网站上输入某个产品的关键字;
2、系统去特定的多个商家网站获取内容(比如做3C的京东、新蛋等);
3、对内容进行分析,价格最低的有货的排在前面。有点类似比价网的意思,听完后觉得难度应该在如何获取商家的产品内容这里。
想了一下大概有二种方法,一是找商家看有没有数据接口之类的东西,这个估计不大可能;二是用类似小偷类的做法,自行去商家页面搜索,但用这种方法效率肯定不好。不知还有没有更好的办法?请高人指点。
1、访客在网站上输入某个产品的关键字;
2、系统去特定的多个商家网站获取内容(比如做3C的京东、新蛋等);
3、对内容进行分析,价格最低的有货的排在前面。有点类似比价网的意思,听完后觉得难度应该在如何获取商家的产品内容这里。
想了一下大概有二种方法,一是找商家看有没有数据接口之类的东西,这个估计不大可能;二是用类似小偷类的做法,自行去商家页面搜索,但用这种方法效率肯定不好。不知还有没有更好的办法?请高人指点。
www.trip58.com/love/index.php
我怎么和一个很不相关的人测的结果也很好?
这个网站里面的源码好像有你想要的 不过代码就的自己分析 呵呵
构建自己的购物搜索引擎一:写一个简单的
不过结合php的话,如果是我就用sphinx
第二步:采用用户触发方式,当用户浏览某商品信息时,ajax在后台更新此商品信息,下一个用户看到的信息就是新的。当然第一次更新完成后也可以刷新当前页面,但稍稍会降低一些体验;这种方法也存在数据的部分不及时,但从可行性上讲,比较好实施。
如果用户 就浏览商品列表呢??要把列表内所有的商品的价格都用AJAX更新吗??这样你觉得效率和速度能好吗??另外某个同样的商品会在N多商城中存在,所以最后还是要归结到怎么去让这些商品归类,也就是查询出某个商品后,能知道这个商品都在哪些商城中出售。
在列表ajax更新显然不可取,人肉编辑就别提了。smarter.com.cn感觉这家做得不错,看它的流程和速度应是本地数据来的。归类也做得不错,估计是人工整理过。
也只能这样了,实时获取的速度真的很慢,测试了用curl模似访问,仅同时访问3个目标就已很慢了。
解决价格排序之类的问题,就需要定时大面积更新,这种更新的频率要很小心,容易被商家kill。至于怎么获取价格,就各显神通吧。
商家kill?这种公开数据它能怎么kill,封IP?