我曾经是一名JAVA WEB程序员,在中国电信工作,2009年12月辞去工作后,来到北京找工作,我现在在一家金融公司做网管,白天工作很是郁闷(网管的郁闷想必大家都知道吧,领导不重视技术,看待搞技术的和看待民工类似),只有晚上下班后,才是我的自由程序员时间,沉浸在我编程得到快感之中。
   
   我现在利用我所有的闲余时间,所有的周末。制作了淘宝网决策搜索引擎啊。但随着项目的制作进展,我发现《淘宝网》自身由于掌握自己数据库,做的会比我更好,目前我计划将项目做成一个网罗各大购物网站的专业搜索引擎,提供各种商品和商家的情报数据,然后可以由程序画出某个特定商品或某个特定店家的商品的价格走势图。为专业VIP用户提供决策!
   
   现在已经得到淘宝网数据库。
   
   由于工作需要,我只能把所有业余时间利用起来制作这个引擎,想以此求得一份IT好工作。望有意者与我联系
   Email:[email protected]
   抱歉,此论坛不支持图片上传我找了一圈没把我的架构图上传上来

解决方案 »

  1.   

    在《淘宝网》购物时,顾客最关心的就是这两个页面(这两个页面的网址sample分别为
    http://item.taobao.com/auction/item_detail.htm?xid=0db1&item_num_id=3899429723&cm_cat=50010388http://rate.taobao.com/user-rate-6456e2ba2c5966d8ef8726667a7953ac.htm),因此这两个页面的信息对于顾客至关重要,这也是我的搜索引擎信息收集的地方。由于有成千上万的这样格式的页面,所以我的目标就是设计出一个爬虫引擎在《淘宝网》上不断地爬,以零下载为条件,直接将目标信息数据导入我创建的数据库中,再进行搜索。
    综合分析这两个典型页面,我们可以得到这样的信息:大部分《淘宝网》的商品和店家信息都是依据这两个页面的格式形式存在的。所以以此便可以写出程序推断出整个《淘宝网》的数据。
    页面HTML源码关键点
      

  2.   

    hjjk123 ,您觉得我用这个求职《淘宝网》有望吗
      

  3.   

    我最终想制作出《淘宝网》搜索引擎成品放于Google App Engine上,大家都可以看到了。以一人之力,累啊。但不能屈服啊!
      

  4.   

    回hjjk123
    这个架构图本来有个更清晰地。太大了,上传不上去。
    我工作一年,09年的计算机系毕业生,虽然我资历尚轻,但我所有时间都在研究程序和数据结构以及算法了,在学校的时候做过一个软件比赛的项目,还得奖了
    在中国电信工作了一年,又自学了不少,我所有的周末都在程序中度过了...做这个搜索引擎,把图论和矩阵的知识都回头温习了遍...
      

  5.   

    呵呵!很好了!lz加油吧!!但lz还是别去做网管了!趁着年轻多学东西吧!其实我没资格说你的!哈哈我还没毕业!大三!马上实习了!按说该请教你!说起比赛 ,由于学校的专业垃圾,以致同学没几个计算机的!有几个学java的学了两年j2se!哎!!做了个项目,基本是自己做的!无语了!!加油吧!!嘿嘿
      

  6.   

    大家看看这个网站,http://www.haodian8.com/
    是不是已经做了我要做的这个工作
      

  7.   

    加油吧! 路还很长... 其实我觉得你想法不错,但没有商业价值。 你说给VIP用户提供,如果VIP用户多了,每个人都知道了,你又准备干什么呢? 再说商品的信息(价格之类)是在现实中体现的,别人用户比你获取信息,分析的更准确。 你所说的VI用户是指淘宝卖家吧!不管买家,还是卖家...都是一个道理。  如果不对,请包涵。受到了打击,就当我放P。 谢绝喷子。 你这样的水平可以找到一个不错的工作。 加油了!
      

  8.   

    lz不错啊,照你的水平,3-4k一点问题没有。我也是做搜索这方面的工作,有时间大家共同学习
      

  9.   

    回lz一句,工资高低跟你做不做网管没有关系,关键看公司,我一朋友在一外企做网管也是过w的,跟公司里做开发的工程师差不多的,如果考出思科的一些高级认证,薪水可以更高,当然你喜欢编程就应该考虑换地方的。
      

  10.   

    各位可以查看一下这个网站,http://www.G9000.com/
    都应该是可以做到我要做的工作了
      

  11.   

    在open.taobao.com上面开发一个有用的应用比你去求职淘宝有用的多。
      

  12.   

    技术上很鲜明,但是这个东西的实用性我看不出来。百度carwl.的不少。谷歌crawl怕的不少。
    直接crawl http://www.baidu.com/s?wd=%CC%D4%B1%A6%D0%AC%D7%D3这个 在他们上面扩展点概念多新颖。。楼主开公司吧 跟你干
      

  13.   

    不知道 这个spider 跟火车头有什么异样否 期待中
      

  14.   

    lz 可以尝试 crawl 一下csdn 当初我写的程序这个爬寻不了。。不知有什么端倪
      

  15.   

    基本功还是扎实的,设计思路也比较明确,面试的时候多把你这个半成产品的架构思路和技术核心阐述一下,如果有demo给面试官更好做网管确实没前途,现在可以考虑跳槽了,找工作的时候记住要突出你在开发方面的实力,面试的时候才会有机会考你技术方面的问题,你做过这么多实践开发,面试的时候还是很有用的薪水你现在的水平要6K~8K在北京应该没问题,加油!
      

  16.   

    淘宝没有像ebay那样提供API么?
    我怎么记得好像有呢!
      

  17.   

    http://my.open.taobao.com/apidoc/index.htm#categoryId:5为何辛苦爬网站??
      

  18.   

    看了LZ的创意和努力,我很佩服.
    我现在虽然是个网站程序员,但有好多的都不懂,上班的时候在不停的搞,可一下班就不想搞了.
    缺少毅力,要向lz学习 楼主加油
      

  19.   

      good luck ~~  
      

  20.   

    楼主我觉得你说这些都没有用,你要去面对现实。去action,别在想这些了