有这么一种情况:
初始网址如:http://s.click.taobao.com/t?e=zGU34CA7K%2BPkqB07S4%2FK0CFcRfH0GoT805sipKkHWyjuss%2FhMemuTfOW00x2UGH2tlyhtaTZLKarMYi29q3csRs4q%2BpheXR%2Fc%2FsW4xdwKvzCsg%3D%3D
点击后它跳转到最终网页如:http://detail.tmall.com/item.htm?id=26212852514&ali_trackid=2:mm_17107220_0_0:1379573083_3k1_2137774678
在最终网页中,可能有“泰坦尼克”这几个文字。现在要实现的功能是
一个aspx页,从数据库表中调取所有初始网址(有很多条),然后逐个判断跳转到的最终网页上是否存在“泰坦尼克”这几个文字,如果存在,则删除数据库表中初始网址所在的数据行。请问各位,该如何写呢?越具体越好。谢谢!跳转网页

解决方案 »

  1.   

    用httpwebrequest类直接去抓取网页就可以了。
    httpwebrequest的autoredirect设置为true的时候,它会自动处理301 302跳转
      

  2.   

    caozhy  ,谢谢!能否贴出具体代码?我对httpwebrequest不太了解。非常感谢!
      

  3.   

    http://www.crifan.com/note_about_website_crawl_and_emulate_login/
      

  4.   

    WebBrowserCrawler webBrowserCrawler = new WebBrowserCrawler();
                string innerHtml = webBrowserCrawler.GetReult(url);
                if (innerHtml.Contains("你的字符"))
                {
                    TextBox1.Text += "true,";
                    //DOTO 删除数据            }
                else
                {
                    TextBox1.Text += "false,";
                }