我曾经是一名JAVA WEB程序员,在中国电信工作,2009年12月辞去工作后,来到北京找工作,我现在在一家金融公司做网管,白天工作很是郁闷(网管的郁闷想必大家都知道吧,领导不重视技术,看待搞技术的和看待民工类似),只有晚上下班后,才是我的自由程序员时间,沉浸在我编程得到快感之中。
我现在利用我所有的闲余时间,所有的周末。制作了淘宝网决策搜索引擎啊。但随着项目的制作进展,我发现《淘宝网》自身由于掌握自己数据库,做的会比我更好,目前我计划将项目做成一个网罗各大购物网站的专业搜索引擎,提供各种商品和商家的情报数据,然后可以由程序画出某个特定商品或某个特定店家的商品的价格走势图。为专业VIP用户提供决策!
现在已经得到淘宝网数据库。
由于工作需要,我只能把所有业余时间利用起来制作这个引擎,想以此求得一份IT好工作。望有意者与我联系
Email:[email protected]
抱歉,此论坛不支持图片上传我找了一圈没把我的架构图上传上来
我现在利用我所有的闲余时间,所有的周末。制作了淘宝网决策搜索引擎啊。但随着项目的制作进展,我发现《淘宝网》自身由于掌握自己数据库,做的会比我更好,目前我计划将项目做成一个网罗各大购物网站的专业搜索引擎,提供各种商品和商家的情报数据,然后可以由程序画出某个特定商品或某个特定店家的商品的价格走势图。为专业VIP用户提供决策!
现在已经得到淘宝网数据库。
由于工作需要,我只能把所有业余时间利用起来制作这个引擎,想以此求得一份IT好工作。望有意者与我联系
Email:[email protected]
抱歉,此论坛不支持图片上传我找了一圈没把我的架构图上传上来
http://item.taobao.com/auction/item_detail.htm?xid=0db1&item_num_id=3899429723&cm_cat=50010388和http://rate.taobao.com/user-rate-6456e2ba2c5966d8ef8726667a7953ac.htm),因此这两个页面的信息对于顾客至关重要,这也是我的搜索引擎信息收集的地方。由于有成千上万的这样格式的页面,所以我的目标就是设计出一个爬虫引擎在《淘宝网》上不断地爬,以零下载为条件,直接将目标信息数据导入我创建的数据库中,再进行搜索。
综合分析这两个典型页面,我们可以得到这样的信息:大部分《淘宝网》的商品和店家信息都是依据这两个页面的格式形式存在的。所以以此便可以写出程序推断出整个《淘宝网》的数据。
这个架构图本来有个更清晰地。太大了,上传不上去。
我工作一年,09年的计算机系毕业生,虽然我资历尚轻,但我所有时间都在研究程序和数据结构以及算法了,在学校的时候做过一个软件比赛的项目,还得奖了
在中国电信工作了一年,又自学了不少,我所有的周末都在程序中度过了...做这个搜索引擎,把图论和矩阵的知识都回头温习了遍...
是不是已经做了我要做的这个工作
都应该是可以做到我要做的工作了
直接crawl http://www.baidu.com/s?wd=%CC%D4%B1%A6%D0%AC%D7%D3这个 在他们上面扩展点概念多新颖。。楼主开公司吧 跟你干
我怎么记得好像有呢!
我现在虽然是个网站程序员,但有好多的都不懂,上班的时候在不停的搞,可一下班就不想搞了.
缺少毅力,要向lz学习 楼主加油