公司最近在弄了一个企业网站,但是发现百度在爬取时老是报302错误,大家有碰到的么,请帮忙解决?日志:
2011-03-01 02:24:51 58.67.138.108 GET /Product.aspx ChannelID=23&ProductID=48263&ProductVariantID=34916&W4midY6U.htm&AspxAutoDetectCookieSupport=1 80 - 123.125.71.34 Baiduspider+(+http://www.baidu.com/search/spider.htm) 302 0 64 78
2011-03-01 02:32:03 58.67.138.108 GET /Product.aspx ChannelID=23&ProductID=43519&ProductVariantID=223608&W4midY6U.htm&AspxAutoDetectCookieSupport=1 80 - 123.125.71.14 Baiduspider+(+http://www.baidu.com/search/spider.htm) 302 0 64 46
2011-03-01 02:46:31 58.67.138.108 GET /Product.aspx ChannelID=23&ProductID=35860&ProductVariantID=440793&W4midY6U.htm&AspxAutoDetectCookieSupport=1 80 - 123.125.71.24 Baiduspider+(+http://www.baidu.com/search/spider.htm) 302 0 64 46
webconfig配置如下:      <section name="urlrewritingnet" requirePermission="false" type="UrlRewritingNet.Configuration.UrlRewriteSection, UrlRewritingNet.UrlRewriter"/>
      </configSections>
  <urlrewritingnet rewriteOnlyVirtualUrls="true" contextItemsPrefix="QueryString" defaultPage="default.aspx" defaultProvider="RegEx" xmlns="http://www.urlrewriting.net/schemas/config/2006/07">
      <rewrites>
<add name="ChannelProductRewrite" virtualUrl="^~/Channel([0-9]*)/Products([0-9]*)/ProductsVariant([0-9]*)/([\w-]*)\.htm?" rewriteUrlParameter="ExcludeFromClientQueryString" destinationUrl="~/Product.aspx?ChannelID=$1&amp;ProductID=$2&amp;ProductVariantID=$3&amp;$4" ignoreCase="true"> 
             </add>   
      </rewrites>
        </urlrewritingnet>
        <httpModules>
<add name="UrlRewriteModule" type="UrlRewritingNet.Web.UrlRewriteModule, UrlRewritingNet.UrlRewriter"/>
       </httpModules>     
 

解决方案 »

  1.   

    “GET /Product.aspx”这就不是什么“伪静态”了吧。伪静态不就是把后缀.aspx伪装成.htm嘛。可是别人.aspx的url来访问,肯定是因为你的某些导航页面里边的url链接信息没有把.aspx改为.htm。
      

  2.   

    IIS,应该是先解析伪静态然后转换成动态的吧?问题是,这个动态页面没有问题啊?为何会报302的错误呢?百度死活都收录不了啊
      

  3.   

    抓取的还是aspx,所有静态化
      

  4.   

    百度访问的是 Product.aspx
    按你的urlrewriter配置 应该是 /channelid/productsid/ProductsVariantid.htm怎么会访问到 aspx的?
    另外,访问aspx的时候难道跳转了
      

  5.   

    回楼上的话,由于是伪静态的地址,所以伪静态的地址会被解释成对应的aspx页面,这个在IIS日志有体现,谷歌,搜搜抓取时,都有一个伪静态地址,然后一个aspx的地址,唯独百度没有,百度爬时只写了一个aspx的页面,而且这个页面有302问题的
      

  6.   

    http://www.adminvc.com/view_143554_5.html