我想从 http://video.shishicai.cn/Assist/BonusVideo.aspx?lt=21 这个网页的html源代码中, 获得这样的数据(即:右边的“最新黑龙江时时彩开奖号码”): 
10009484 77032
10009483 61116
10009482 48677
10009481 10651
10009480 68129
10009479 83440
10009478 98628
10009477 46152
10009476 97475
10009475 17488
10009474 49782
其他内容不要。 请问:怎样用正则表达式来实现? 

解决方案 »

  1.   

    匹配<div class="ps3">里面的table 再匹配每一个TR 里面的就是你要的数据了
      

  2.   

    <table>[\s|\S]+</table>
    <tr>[\s|\S]+?</tr>
    <td>[\s|\S]+?</td>
    应该这样就可以了
      

  3.   

    最后一个应该改成(?<=<td>)\d+(?=</td>)
      

  4.   

     StreamReader sr = new StreamReader("e:\\test.txt",Encoding.UTF8);
                Regex reg1= new Regex("<td [^>]*>(.*?)</td>", RegexOptions.IgnoreCase);
                MatchCollection mc1= reg1.Matches(sr.ReadToEnd()); 
                foreach (Match m1 in mc1)
                {
                   str += m1.Groups[1].Value + m1.Groups[2].Value + m1.Groups[3].Value + Environment.NewLine; ;
                }
                sr.Close();http://topic.csdn.net/u/20090819/10/8b3d325c-5c9e-4e17-b344-a26f13e20aba.html?seed=2057216004&r=59199023
      

  5.   

    URL:
    http://soft.shishicai.cn/Assist/BonusRecent.aspx?lt=21&d=4068a6abd4a4f2d0a20fc0de82a3eb83&random=Thu%20Oct%2029%202009%2010:21:10%20GMT+0800期号
    /html/body/form[@id='form1']/div[2]/div/table/tbody/tr/td[1]/text()开奖号码
    /html/body/form[@id='form1']/div[2]/div/table/tbody/tr/td[2]/text()
      

  6.   

    大家好,我是楼主
    -----------------------
    开始给的网址不好取数据。用下面这个网址:http://www.shishicai.cn/Lottery/Speed/FCHLJSSC/Trend/mt_zs_jrzh.aspx获得这样的数据(即:左边的“期号 开奖号码”): 
    009484 77032
    009485 16467 
    009486 76759 
    009487 05783 
    009488 71821 
    009489 97009 
    009490 73301 
    009491 24909 
    ... ...
    其他内容不要。 请问:怎样用正则表达式来实现?
      

  7.   

    大家好,我是楼主 
    ----------------------- 
    开始给的网址不好取数据。 用下面这个网址:http://www.shishicai.cn/Lottery/Speed/FCHLJSSC/Trend/mt_zs_jrzh.aspx 获得这样的数据(即:左边的“期号 开奖号码”): 
    009484 77032 
    009485 16467 
    009486 76759 
    009487 05783 
    009488 71821 
    009489 97009 
    009490 73301 
    009491 24909 
    ... ... 
    其他内容不要。 请问:怎样用正则表达式来实现?
      

  8.   

    WebClient client = new WebClient();
                Byte[] pageData = client.DownloadData("http://www.shishicai.cn/Lottery/Speed/FCHLJSSC/Trend/mt_zs_jrzh.aspx");
                string pageHtml = Encoding.Default.GetString(pageData);            Regex reg = new Regex(@"[1]\d(\d{6})\|(\d{5})");
                MatchCollection mc = reg.Matches(pageHtml);
                foreach (Match m in mc)
                {
                    Console.WriteLine(m.Groups[1].ToString() + " " + m.Groups[2].ToString() + "\r\n");
                }
    /*
    009484 77032009485 16467009486 76759009487 05783009488 71821009489 97009009490 73301009491 24909009492 55805009493 79039*/