我想做一个关于书的网站,我怎么在一个已知的网站上得到这些信息,
我怎么把这些信息存到数据库里,可能是几十万甚至是上百万条记录。谢谢!!!

解决方案 »

  1.   

    是啊,比如chinapub上所有书的信息(书名,作者,价格等),
    然后怎么把这些信息批量插入数据库。
    我开始想用那种读取网页内容的程序读取,可是我读出的只是某一个网址的所有内容,怎么把含有书信息的所有网页信息都读出呢?
    即使都读出来了,插入我也不知道怎么弄了?
      

  2.   

    你的这个就是一个书的搜索引擎嘛!像google一样把别人网站的信息拿来自己使用!可以研究一下看看他们怎么做得!
      

  3.   


    暂时不可能实现了:)
    数据的搜索定位是搜索引擎的难题之一。
    如果可以的,现在最大的分类广告网站应该是google或者任何一家搜索引擎公司。主要的难点在于,每一个网页中,用于标记指定信息的标签不统一,不可能通过搜索引擎的方式把网页中指定信息搜集下来。除非,所有的网页都提供rss,并且最好能够指定统一标识,比如,商品名称都统一用name等等。或者网页代码中,每一个信息都指定id或name。现有的分类站点,都是处理自己发布的分类信息。那些提供其他站点同类信息比对的,都是通过人工来实现的:)呵呵~
    不排除有一天能够有人做到:)
      

  4.   

    借光:路过的各位,帮忙看看这几个帖子,看怎么解决;)
    谢谢啦!关于客户端页面从数据库中读取大量图片的问题
    http://community.csdn.net/Expert/TopicView3.asp?id=4816106乱码还原问题!
    http://community.csdn.net/Expert/TopicView3.asp?id=4813786关于javabean反射代理的问题
    http://community.csdn.net/Expert/TopicView3.asp?id=4813935大家帮忙顶顶!