HTML如下:
<tr>                   <td width='20' class='hei14'>·</td>                  <td width='360'><a href=http://news.xinhuanet.com/travel/2007-05/17/content_6108964.htm target='_blank' class='hei14'>武夷山风景名胜区门票价格上调</a><span class='sj'>(05-17)</span></td>                </tr>需要获取
1,http://news.xinhuanet.com/travel/2007-05/17/content_6108964.htm
2,武夷山风景名胜区门票价格上调
3,05-17

解决方案 »

  1.   

    格式固定吗,楼主应该是要同时取多个吧,这样试下string yourStr = ...........;
    MatchCollection mc = Regex.Matches(yourStr, @"<tr[^>]*?>[\s\S]*?<a\s+href=([""']?)(?<url>[^""'\s]*)\1?[^>]*?>(?<text>[^<]*?)</a>\s*<span[^>]*?>\((?<time>[^<\)]*?)\)</span></td>\s*</tr>", RegexOptions.IgnoreCase);
    foreach (Match m in mc)
    {
         richTextBox2.Text += m.Groups["url"].Value + "\n";
         richTextBox2.Text += m.Groups["text"].Value + "\n";
         richTextBox2.Text += m.Groups["time"].Value + "\n";
    }
      

  2.   

    在问一个
    <div id="Time"></div>
                <div id="Position"></div>
                <div id="Image"></div>
                <div id="Content"> <font id="Zoom"> 
                  <P>&nbsp;&nbsp;&nbsp;&nbsp;新华网福州5月16日专电(记者沈汝发)福建省物价局日前重新核定了武夷山风景名胜区门票价格,一日游、二日游和三日游价格都上调了30元,分别达到140元、150元和160元。 
    <P>&nbsp;&nbsp;&nbsp;&nbsp;福建省物价局有关负责人表示,这是根据《福建省游览参观点门票价格管理规定》,结合武夷山风景名胜区基本建设、环保和管理的实际情况,经成本监审、召开听证会,广泛听取各方意见和物价局审价委员会集体审议决定的。 
    <P>&nbsp;&nbsp;&nbsp;&nbsp;这位负责人说,武夷山主要景点包括:云窝景点、武夷宫景点、一线天—虎啸岩景点、水帘—大红袍景点、山北景区等景点。门票价格包含资源保护费和副食品价格调节基金。另外,对学生、教师、现役军人、残疾人、老年人等游客门票价格的优惠政策,仍按《福建省游览参观点门票价格管理规定》执行。</P>
    <P align=center>
    <TABLE style="WIDTH: 438px; HEIGHT: 162px" height=162 cellSpacing=4 cellPadding=4 width=438 border=1>
    <CAPTION><FONT color=#ff00ff size=3><STRONG>精彩推荐</STRONG></FONT></CAPTION><TR>
    <TD><IMG src="xinsrc_1020504161620577803240.jpg" border=0 ></TD>
    <TD><IMG src="xinsrc_10205041616209171151541.jpg" border=0 ></TD>
    <TD><IMG src="xinsrc_3020504161622137852848.jpg" border=0 ></TD></TR>
    <TR>
    <TD>
    <P align=center><A href="http://news.xinhuanet.com/travel/2007-04/17/content_5987273.htm" target=_blank><FONT color=#ff00ff>空姐比美 各具风韵(图)<FONT><U></U></FONT></FONT></A></P></TD>
    <TD style="HEIGHT: 25px" vAlign=center align=left>
    <P align=center><A href="http://news.xinhuanet.com/travel/2007-04/28/content_6040574.htm"><FONT color=#ff00ff>希腊美人飞向爱琴海</FONT><FONT><U></U></FONT></A></P></TD>
    <TD>
    <P align=center><A href="http://news.xinhuanet.com/travel/2007-04/16/content_5982467.htm" target=_blank><FONT color=#ff00ff>旅途艳遇不只"男和女"</FONT></A></P></TD></TR></TABLE></P>
                  </font></div>
    获取>&nbsp;&nbsp;&nbsp;&nbsp;新华网福州5月16日专电(记者沈汝发)福建省物价局日前重新核定了武夷山风景名胜区门票价格,一日游、二日游和三日游价格都上调了30元,分别达到140元、150元和160元。 
    <P>&nbsp;&nbsp;&nbsp;&nbsp;福建省物价局有关负责人表示,这是根据《福建省游览参观点门票价格管理规定》,结合武夷山风景名胜区基本建设、环保和管理的实际情况,经成本监审、召开听证会,广泛听取各方意见和物价局审价委员会集体审议决定的。 
    <P>&nbsp;&nbsp;&nbsp;&nbsp;这位负责人说,武夷山主要景点包括:云窝景点、武夷宫景点、一线天—虎啸岩景点、水帘—大红袍景点、山北景区等景点。门票价格包含资源保护费和副食品价格调节基金。另外,对学生、教师、现役军人、残疾人、老年人等游客门票价格的优惠政策,仍按《福建省游览参观点门票价格管理规定》执行。
    怎么写?
      

  3.   

    在要提取内容这前的
    <div id="Time"></div>
                <div id="Position"></div>
                <div id="Image"></div>
                <div id="Content"> <font id="Zoom"> 
    这些代码里,哪一部分是固定的,也就是通过什么来定位这一部分内容
    它后面的
    <P align=center>
    <TABLE style="WIDTH: 438px; HEIGHT: 162px" height=162 cellSpacing=4 cellPadding=4 width=438 border=1>
    也一样道理,哪些是固定的
      

  4.   

    lxcnn(过客),我们能单聊吗?我QQ是187265299
      

  5.   

    <div id="Content"> <font id="Zoom"> 
                  <P>&nbsp;&nbsp;&nbsp;&nbsp;新华网福州5月16日专电(记者沈汝发)福建省物价局日前重新核定了武夷山风景名胜区门票价格,一日游、二日游和三日游价格都上调了30元,分别达到140元、150元和160元。 
    <P>&nbsp;&nbsp;&nbsp;&nbsp;福建省物价局有关负责人表示,这是根据《福建省游览参观点门票价格管理规定》,结合武夷山风景名胜区基本建设、环保和管理的实际情况,经成本监审、召开听证会,广泛听取各方意见和物价局审价委员会集体审议决定的。 
    <P>&nbsp;&nbsp;&nbsp;&nbsp;这位负责人说,武夷山主要景点包括:云窝景点、武夷宫景点、一线天—虎啸岩景点、水帘—大红袍景点、山北景区等景点。门票价格包含资源保护费和副食品价格调节基金。另外,对学生、教师、现役军人、残疾人、老年人等游客门票价格的优惠政策,仍按《福建省游览参观点门票价格管理规定》执行。</P>
    <div id="Content"> <font id="Zoom"> 
                  <P>
    ...</p>
    是固定的
      

  6.   

    刚才吃饭去了,前面的知道了,后面的呢,这样试下吧string yourStr = ...............;
    MatchCollection mc = Regex.Matches(yourStr, @"<div\s+id=""Content"">\s*<font\s+id=""Zoom"">(?<content>[\s\S]*?)</p>\s*<p\s[^>]*?>", RegexOptions.IgnoreCase);
    foreach (Match m in mc)
    {
        richTextBox2.Text += m.Groups["content"].Value.Trim();
    }