我想从 http://video.shishicai.cn/Assist/BonusVideo.aspx?lt=21 这个网页的html源代码中, 获得这样的数据(即:右边的“最新黑龙江时时彩开奖号码”):
10009484 77032
10009483 61116
10009482 48677
10009481 10651
10009480 68129
10009479 83440
10009478 98628
10009477 46152
10009476 97475
10009475 17488
10009474 49782
其他内容不要。 请问:怎样用正则表达式来实现?
10009484 77032
10009483 61116
10009482 48677
10009481 10651
10009480 68129
10009479 83440
10009478 98628
10009477 46152
10009476 97475
10009475 17488
10009474 49782
其他内容不要。 请问:怎样用正则表达式来实现?
<tr>[\s|\S]+?</tr>
<td>[\s|\S]+?</td>
应该这样就可以了
Regex reg1= new Regex("<td [^>]*>(.*?)</td>", RegexOptions.IgnoreCase);
MatchCollection mc1= reg1.Matches(sr.ReadToEnd());
foreach (Match m1 in mc1)
{
str += m1.Groups[1].Value + m1.Groups[2].Value + m1.Groups[3].Value + Environment.NewLine; ;
}
sr.Close();http://topic.csdn.net/u/20090819/10/8b3d325c-5c9e-4e17-b344-a26f13e20aba.html?seed=2057216004&r=59199023
http://soft.shishicai.cn/Assist/BonusRecent.aspx?lt=21&d=4068a6abd4a4f2d0a20fc0de82a3eb83&random=Thu%20Oct%2029%202009%2010:21:10%20GMT+0800期号
/html/body/form[@id='form1']/div[2]/div/table/tbody/tr/td[1]/text()开奖号码
/html/body/form[@id='form1']/div[2]/div/table/tbody/tr/td[2]/text()
-----------------------
开始给的网址不好取数据。用下面这个网址:http://www.shishicai.cn/Lottery/Speed/FCHLJSSC/Trend/mt_zs_jrzh.aspx获得这样的数据(即:左边的“期号 开奖号码”):
009484 77032
009485 16467
009486 76759
009487 05783
009488 71821
009489 97009
009490 73301
009491 24909
... ...
其他内容不要。 请问:怎样用正则表达式来实现?
-----------------------
开始给的网址不好取数据。 用下面这个网址:http://www.shishicai.cn/Lottery/Speed/FCHLJSSC/Trend/mt_zs_jrzh.aspx 获得这样的数据(即:左边的“期号 开奖号码”):
009484 77032
009485 16467
009486 76759
009487 05783
009488 71821
009489 97009
009490 73301
009491 24909
... ...
其他内容不要。 请问:怎样用正则表达式来实现?
Byte[] pageData = client.DownloadData("http://www.shishicai.cn/Lottery/Speed/FCHLJSSC/Trend/mt_zs_jrzh.aspx");
string pageHtml = Encoding.Default.GetString(pageData); Regex reg = new Regex(@"[1]\d(\d{6})\|(\d{5})");
MatchCollection mc = reg.Matches(pageHtml);
foreach (Match m in mc)
{
Console.WriteLine(m.Groups[1].ToString() + " " + m.Groups[2].ToString() + "\r\n");
}
/*
009484 77032009485 16467009486 76759009487 05783009488 71821009489 97009009490 73301009491 24909009492 55805009493 79039*/