我想搞一个开源的爬虫,可以爬专用的一些信息。大家给点建议,说是否可行。
还有,我也没钱,我只有想法。
如果可行的话,大家给点建议。怎么搞。集思广益。
有兴趣的加:qq-  41968472   注明:开源。或者爬虫。

解决方案 »

  1.   

    想法是好的,不过目前已经有许多开源的爬虫项目了,而且都很不错。
    http://www.open-open.com/68.htm你可以考虑一下有什么需求是目前这些爬虫项目无法满足的,再来决定你的这个爬虫项目要如何来做,做些什么。
      

  2.   

    爬虫就是可以自动抓取网页的程序。
    谢谢你们的关注。
    http://www.open-open.com/68.htm这个网站很好,对我很有启发很使用。我刚接触爬虫时间也不是很长。
    IceCraft(心淡情浓):thanks!
    =======================================
    我的想法是这样的:我想搞个爬虫,可以抓取各大高校BBS或者就业网的信息,就是要抓取就业记录了。对HTML的解析要求比较高。
    现在有几个抓取就业网的爬虫了。我这里主要想抓取高校BBS的,提取出实习兼职信息。因为实习兼职信息在高校的BBS居多,这些信息很多学生都无法获得或者获取比较困难。
    像这个网站:www.BaiduPlus.com
    这个想法可能对HTML解析比较高,现在其实也有HTML Parsing。
    但我想我们中国人也要有自己的东西。
    这样计划,我觉得参与者主要是高校的学生,不少学生没有实习兼职的任务,他们能够参与进来的话对自己也是提高。做出来的东西(如果能的话)成果当然属于我们所有人的拉。做不出来的话,我会坚持下去。
    一点小小的愚见。大家多多指教。