想知道怎么把google搜索结果中的网址取出来?
假设输入一个搜索词汇“剃须刀”,google的搜索结果会主要包含三部分:标题,简介,所在的网站网址。现在想把所有这些网址输出来,怎么做?已知解决办法:
1 先下载网页,然后用分析网页htmlParse包,分解网页
2 使用google api,看了网上很多文章,好多03年的文章,那时google api好像还比较简单,使用google api的Java接口,你构建好查询之后,然后查询,最后会返回一个类,这个类中就有网址信息。但是我现在去看新的api反而很迷糊,而且又分data api和base api,有点找不到头绪有人能指点一下吗?

解决方案 »

  1.   

    SOAP Search API 2006年底就不给新api key了,如果你以前没申请过api key,那就不能用了。
    现在只有ajax search api了。  简单使用,不过要通过java程序访问可能就不容易了。
      

  2.   

    如果不行,就自己用 正则表达式 解析吧!也不是很复杂,因为google的格式很规范的
      

  3.   

    我当时侯调用过google的web服务,用jdic做的,你要的话我给你一份
      

  4.   

    ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++力争成为中国最大的架构师群联盟,架构师1群:43545919已满,2群:59048426的招募也近尾声,
    现3群:17303696正式 开放,各群内容基本相同,高手也经过群主进行了调整,希望大家不必重复加入!
    培训经过筛选才会进行,请大家不必 着急!!!已经上传的顶级软件产品的架构分析,本群资料仅供研究学习,不得商用!!!
    google 、
    eBay、
    Youtube、
    淘宝等
    ......
    技术文章包括:
    《自己动手写操作系统》
    《搜索引擎-原理、技术与系统》
    《企业应用架构模式》
    ......
    重要的RUP实例
    设计模式精解
    ......
    资料陆续上传中++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++