网页分页内容的抓取

网页是用__doPostBack翻页，只能取到第一页，不知道怎么回事？ string responseData = RequestHelper.RequestHTML("http://www.xxxxxxx.cc/", "gbk");            string exp = "id=\"__VIEWSTATE\" value=\"([\\s\\S]*?)\" />";
            Match match = Regex.Match(responseData, exp, RegexOptions.IgnoreCase);           string num = match.Groups[1].Value.ToString();
         for (int i = 0; i < 8; i++)
            {
                System.Net.WebClient WebClientObj = new System.Net.WebClient();
                System.Collections.Specialized.NameValueCollection PostVars = new System.Collections.Specialized.NameValueCollection();
                PostVars.Add("document.forms['form1'].__VIEWSTATE", num);
                PostVars.Add("document.forms['form1'].__EVENTTARGET", "AspNetPager1");
                PostVars.Add("document.forms['form1'].__EVENTARGUMENT", i.ToString());
                WebClientObj.Headers.Add("ContentType", "text/html; charset=utf-8");

                    byte[] byte1 = WebClientObj.UploadValues("http://www.xxxxxx.cc/","POST", PostVars);
                    string ResponseStr = Encoding.UTF8.GetString(byte1); //得到当前页面对应的html 文本字符串



                }

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

function __doPostBack(eventTarget, eventArgument) {
    if (!theForm.onsubmit || (theForm.onsubmit() != false)) {
        theForm.__EVENTTARGET.value = eventTarget;
        theForm.__EVENTARGUMENT.value = eventArgument;
        theForm.submit();
    }
}
应该是因为翻页部分是javascript代码写的，匹配不出下一页的链接的当然只能抓取当前页了。
至于怎么解析JS，楼主可以去研究一下javascript引擎。
你抓取的内容就是固定在第一页了，
我以前写了一个抓取新浪用户信息的，用的是webbrowser控件
话说分页没用过__doPostBack，都是自己写分页控件，重新读取后台信息
参数好像都不对，能抓取就怪了                PostVars.Add("__VIEWSTATE", num);
                PostVars.Add("__EVENTTARGET", "ctl00$MainContent$AspNetPager1");
                PostVars.Add("__EVENTARGUMENT", i.ToString());还有获取网页内容改变下VIEWSTATE的值
                    string ResponseStr = Encoding.UTF8.GetString(byte1); //得到当前页面对应的html 文本字符串
                    match = Regex.Match(ResponseStr, exp, RegexOptions.IgnoreCase);
                    num = match.Groups[1].Value.ToString();再试试看