本帖最后由 xuzuning 于 2012-09-09 18:21:19 编辑

解决方案 »

  1.   

    打开新浪, 看图片地址, curl拿下来。
      

  2.   

    你说的是favicon图标?
    google api: http://www.google.com/s2/favicons?domain=www.sina.com.cn
    或者PHP代码: http://www.controlstyle.com/articles/programming/text/php-favicon/
      

  3.   

    根据curl获取页面源码,正则匹配不就可以
      

  4.   


    正则匹配的话前提是他的logo url地址必须要有logo字样,而其他的图标地址没有logo字样?
      

  5.   


    不是favicon图标,是指页面上的图标。
      

  6.   

    <embed src=http://www.baidu.com>
      

  7.   

    看看这个图片是不是写在css的代码里了...所以你光看html未必能看到引用的内容.
      

  8.   

    就是这个道理,logo url行内没有统一标准,不一顶要用logo命名,可以是公司名,网站名,甚至一个有纪念意义的名字。没有规律的东西无法用程序获取,只有人工操作。可以尝试遵循这样的规律:logo图标尺寸大多位于BODY的开头数的第一张,并且长和宽至少大于32,这样的匹配也不能达到100%,曾经看到过网站将logo设置为背景图,而不是img……