在以下“原文本”中提取夹在“起始代码”和“终止代码”之间的所有html代码
谢谢 * * * 起始代码: * * * 
<TD stylt="padding-bottom:10px;"><table width="99%" border="0" align="center" cellpadding="0" cellspacing="0"> * * * 终止代码: * * * 
<td width="57"><a href="/ent/lscf/index.shtml">滚动新闻</a></td>
        <td width="12">|</td>
        <td width="57"><a href="/ent/mx/index.shtml">明&nbsp;&nbsp;星</a>&nbsp;</td> * * *  原文本: * * *<TABLE width=1004 border=0 cellPadding=0 cellSpacing=0 bgcolor="#FFFFFF" class="menuborder">
  <TBODY>
    <TR>
      <TD stylt="padding-bottom:10px;"><table width="99%" border="0" align="center" cellpadding="0" cellspacing="0">
        <tr class="menubg1">
          <td height="1"></td>
        </tr>
        <tr>
          <td height="20" valign="bottom" class="menubg7"><table width="99%" border="0" align="center" cellpadding="0" cellspacing="0" class="font01">
              <tr class="menubg4">
                <td class="texttx001"><script language="javascript" src="http://www.ce.cn/include/ce_menu1.js"></script></td>
              </tr>
          </table></td>
        </tr>
        <tr class="menubg2">
          <td height="1"></td>
        </tr>
        <tr>
          <td height="20" valign="bottom" class="menubg8"><table width="99%" border="0" align="center" cellpadding="0" cellspacing="0" class="font01">
              <tr class="menubg5">
                <td class="texttx001"><script language="javascript" src="http://www.ce.cn/include/ce_menu2.js"></script></td>
              </tr>
          </table></td>
        </tr>
        <tr class="menubg3">
          <td height="1"></td>
        </tr>
        <tr>
          <td height="20" valign="bottom" class="menubg9"><table width="99%" border="0" align="center" cellpadding="0" cellspacing="0" class="font02">
              <tr class="menubg6">
                <td class="texttx001"><script language="javascript" src="http://www.ce.cn/include/ce_menu3.js"></script></td>
              </tr>
          </table></td>
        </tr>
        <tr bgcolor="#FFFFFF">
          <td height="1"></td>
        </tr>
        <tr>
          <td height="25"><script language="javascript" src="http://www.ce.cn/include/ce_menu4.js"></script></td>
        </tr>
      </table>        </TD>
    </TR>
  </TBODY>
</TABLE>
<table width="1004" border="0" cellspacing="0" cellpadding="0" class="font-white">
  <tr>
    <td width="2" height="26" bgcolor="#333333"></td>
    <td width="217" rowspan="2"><a href="http://www.ce.cn/ent/"><img src="/ent/images/ent2006_logo.gif" width="217" height="53" border="0"></a></td>
    <td height="26" align="left" valign="middle" background="/ent/images/ent2006_bg001.gif"><table width="100%" height="26" border="0" cellpadding="0" cellspacing="0">
      <tr align="center">
        <td width="57"><a href="/ent/index.shtml">首&nbsp;&nbsp;页</a></td>
        <td width="12">|</td>
        <td width="57"><a href="/ent/lscf/index.shtml">滚动新闻</a></td>
        <td width="12">|</td>
        <td width="57"><a href="/ent/mx/index.shtml">明&nbsp;&nbsp;星</a>&nbsp;</td>
        <td width="12">|</td>
        <td width="57"><a href="/ent/dy/index.shtml">电&nbsp;&nbsp;影</a></td>
        <td width="12">|</td>
        <td width="57"><a href="/ent/ds/index.shtml">电&nbsp;&nbsp;视</a></td>
        <td width="12">|</td>
        <td width="57"><a href="/ent/yspl/index.shtml">影视评论</a></td>
        <td width="12">|</td>
        <td width="57"><a href="/ent/yyst/index.shtml">音&nbsp;&nbsp;乐</a></td>
        <td width="12">|</td>
        <td width="57"><a href="http://www.ce.cn/ent/ylzk/No12/index.shtml" target="_blank">娱乐周刊</a></td>
        </trs_outline>
        <td width="12">|</td>
        <td width="57"><a href="/ent/ztjx/index.shtml">专&nbsp;&nbsp;题</a></td>
        <td width="12">|</td>
        <td width="57"><a href="http://www.chinaonly.cn/pint/">演出票</a></td>
        <td width="12">&nbsp;</td>
        <td width="57">&nbsp;</td>
      </tr>
    </table></td>
    <td width="5" bgcolor="#6d6d6d"></td>
  </tr>
  <tr>
    <td height="26" bgcolor="#333333"></td>
    <td height="27" align="left" valign="middle" background="/ent/images/ent2006_bg002.gif"><marquee border="0" align="middle" scrollamount="2" scrolldelay="25" behavior="scroll" width="100%" onMouseMove="this.stop()" onMouseOut="this.start()">

解决方案 »

  1.   

    按你的要求提取了中间的代码,不含两头,但这不是一个完整的html格式,你可相应的修改一下string str = @"TABLE width=1004 border=0 cellPadding=0 cellSpacing=0 bgcolor=""#FFFFFF"" class=""menuborder"">
      <TBODY>
        <TR>
          <TD stylt=""padding-bottom:10px;""><table width=""99%"" border=""0"" align=""center"" cellpadding=""0"" cellspacing=""0"">
            <tr class=""menubg1"">
              <td height=""1""></td>
            </tr>
            <tr>
              <td height=""20"" valign=""bottom"" class=""menubg7""><table width=""99%"" border=""0"" align=""center"" cellpadding=""0"" cellspacing=""0"" class=""font01"">
                  <tr class=""menubg4"">
                    <td class=""texttx001""><script language=""javascript"" src=""http://www.ce.cn/include/ce_menu1.js""></script></td>
                  </tr>
              </table></td>
            </tr>
            <tr class=""menubg2"">
              <td height=""1""></td>
            </tr>
            <tr>
              <td height=""20"" valign=""bottom"" class=""menubg8""><table width=""99%"" border=""0"" align=""center"" cellpadding=""0"" cellspacing=""0"" class=""font01"">
                  <tr class=""menubg5"">
                    <td class=""texttx001""><script language=""javascript"" src=""http://www.ce.cn/include/ce_menu2.js""></script></td>
                  </tr>
              </table></td>
            </tr>
            <tr class=""menubg3"">
              <td height=""1""></td>
            </tr>
            <tr>
              <td height=""20"" valign=""bottom"" class=""menubg9""><table width=""99%"" border=""0"" align=""center"" cellpadding=""0"" cellspacing=""0"" class=""font02"">
                  <tr class=""menubg6"">
                    <td class=""texttx001""><script language=""javascript"" src=""http://www.ce.cn/include/ce_menu3.js""></script></td>
                  </tr>
              </table></td>
            </tr>
            <tr bgcolor=""#FFFFFF"">
              <td height=""1""></td>
            </tr>
            <tr>
              <td height=""25""><script language=""javascript"" src=""http://www.ce.cn/include/ce_menu4.js""></script></td>
            </tr>
          </table>        </TD>
        </TR>
      </TBODY>
    </TABLE>
    <table width=""1004"" border=""0"" cellspacing=""0"" cellpadding=""0"" class=""font-white"">
      <tr>
        <td width=""2"" height=""26"" bgcolor=""#333333""></td>
        <td width=""217"" rowspan=""2""><a href=""http://www.ce.cn/ent/""><img src=""/ent/images/ent2006_logo.gif"" width=""217"" height=""53"" border=""0""></a></td>
        <td height=""26"" align=""left"" valign=""middle"" background=""/ent/images/ent2006_bg001.gif""><table width=""100%"" height=""26"" border=""0"" cellpadding=""0"" cellspacing=""0"">
          <tr align=""center"">
            <td width=""57""><a href=""/ent/index.shtml"">首&nbsp;&nbsp;页</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/lscf/index.shtml"">滚动新闻</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/mx/index.shtml"">明&nbsp;&nbsp;星</a>&nbsp;</td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/dy/index.shtml"">电&nbsp;&nbsp;影</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/ds/index.shtml"">电&nbsp;&nbsp;视</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/yspl/index.shtml"">影视评论</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/yyst/index.shtml"">音&nbsp;&nbsp;乐</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""http://www.ce.cn/ent/ylzk/No12/index.shtml"" target=""_blank"">娱乐周刊</a></td>
            </trs_outline>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/ztjx/index.shtml"">专&nbsp;&nbsp;题</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""http://www.chinaonly.cn/pint/"">演出票</a></td>
            <td width=""12"">&nbsp;</td>
            <td width=""57"">&nbsp;</td>
          </tr>
        </table></td>
        <td width=""5"" bgcolor=""#6d6d6d""></td>
      </tr>
      <tr>
        <td height=""26"" bgcolor=""#333333""></td>
        <td height=""27"" align=""left"" valign=""middle"" background=""/ent/images/ent2006_bg002.gif""><marquee border=""0"" align=""middle"" scrollamount=""2"" scrolldelay=""25"" behavior=""scroll"" width=""100%"" onMouseMove=""this.stop()"" onMouseOut=""this.start()"">
    ";

     
    string sStart = @"<TD stylt=""padding-bottom:10px;""><table width=""99%"" border=""0"" align=""center"" cellpadding=""0"" cellspacing=""0"">";
    string sEnd = @"<td width=""57""><a href=""/ent/lscf/index.shtml"">滚动新闻</a></td>
            <td width=""12"">|</td>
            <td width=""57""><a href=""/ent/mx/index.shtml"">明&nbsp;&nbsp;星</a>&nbsp;</td>"; str = System.Text.RegularExpressions.Regex.Replace(str,@"[\s\S]*?"+sStart+@"([\s\S]*)?"+sEnd+@"[\s\S]*?$","$1"); Response.Write(str);
    ------说错了莫怪。
      

  2.   

    这个我会   做采集的吧  
    可我这个问题 你能帮我吗?  帮我一下 我立即给你发代码http://community.csdn.net/Expert/TopicView1.asp?id=5253088
      

  3.   

    提不出啊,还是整篇内容===========>不会,你copy全部代码运行一下看客户端的代码起始是:  <tr class="menubg1">
              <td height="1"></td>
            </tr>
            <tr>
    结束是:
      <td width="57"><a href="/ent/index.shtml">首&nbsp;&nbsp;页</a></td>
            <td width="12">|</td>
    ------说错了莫怪。
      

  4.   

    zhangyunjian1(赚钱吧) ( ) 信誉:61    Blog 
    *********************
    你那个问题我可以解决,不过比较烦一些
    其实了比较好解决,难的在于分页的重写参见:http://www.valca.cn
      

  5.   

    cpp2017(幕白兄) ( ) 我的sStart和sEnd是直接从textbox中输入的,需要把双引号替换为两个双引吗?
    我是用VB:
        'sContent是原文本
        Dim sTr1, sTr2 As String
            sTr1 = Trim(TextBox1.Text)
            sTr2 = Trim(TextBox2.Text)
            If sTr1 <> "" Then
                Dim sMatch As Match = Regex.Match(sContent, "^" + sTr1 + "([\s\S]*)" + sTr2 + "$", RegexOptions.Multiline)
                strOut.Text = sMatch.Groups(0).Value
                strOut.Text += sMatch.Groups(1).Value
            End If
      

  6.   

    "^" + sTr1 + "([\s\S]*)" + sTr2 + "$"这样写的话,那么str1必须是开始的代码。str2必须是结束的代码。去掉^ 和 $吧。
    ------说错了莫怪。
      

  7.   

    cpp2017(幕白兄) ( ) 信誉:100    Blog 真是麻烦你了,谢谢,我就是去掉了头和尾也不行双引号要替换掉吗?不知道如何替
      

  8.   

    双引号不替换。try
    Dim sMatch As Match = Regex.Match(sContent, "^" + sTr1 + "([\s\S]*)" + sTr2 + "$", RegexOptions.Multiline)===》Dim sMatch As Match = Regex.Match(sContent, @"[\s\S]*?"+sTr1 +@"([\s\S]*)?"+sTr2 +@"[\s\S]*?$",RegexOptions.Multiline)
    ------说错了莫怪。
      

  9.   

    strOut.Text = sContent
            Dim sTr1, sTr2 As String
            sTr1 = Trim(TextBox1.Text)
            sTr2 = Trim(TextBox2.Text)
            If sTr1 <> "" Then
                Dim sMatch As Match = Regex.Match(sContent, sTr1 + "([\s\S]*)" + sTr2)
                strOut.Text = sMatch.Groups(0).Value
                strOut.Text += sMatch.Groups(1).Value
            End If以上代码不行
      

  10.   

    strOut.Text = sContent
            Dim sTr1, sTr2 As String
            sTr1 = Trim(TextBox1.Text)
            sTr2 = Trim(TextBox2.Text)
            sContent = Trim(TextBox3.Text)
            If sTr1 <> "" Then
                Dim sMatch As Match = Regex.Match(sContent, "[\s\S]*?" + sTr1 + "([\s\S]*)?" + sTr2 + "[\s\S]*?$", RegexOptions.Multiline)
                strOut.Text = sMatch.Groups(0).Value
                strOut.Text += sMatch.Groups(1).Value
            End If******************
    VB不用@,以上代码捕得的还是空的
      

  11.   

    可能就是str1和str2的问题了输入的内容要和原文一模一样,多一个空格或回车都不行,你可先从原文中copy一段,注
    ------说错了莫怪。
      

  12.   

    cpp2017(幕白兄) ( ) 信誉:100    Blog  2006-12-25 00:38:04  得分: 0  
     
     
       可能就是str1和str2的问题了输入的内容要和原文一模一样,多一个空格或回车都不行,你可先从原文中copy一段,注
    ------说错了莫怪。
      
     
    **********************
    我确实是copy的,这点常识还是有的
    你那里测试可以提取吗?
    原文本是用WebRequest取的,使用的是默认编码,这个没问题吧
      

  13.   

    * * * 起始代码: * * * 
    <TD stylt="padding-bottom:10px;"><table width="99%" border="0" align="center" cellpadding="0" cellspacing="0"> * * * 终止代码: * * * 
    用这个代码即可
    嘎嘎public string caijiclass(int q1,int q2,string kai,string guan,string zong) //数据采集类2
    {

    string urlxxx;
    try 

    {
    q1 = zong.IndexOf(kai, q2);
    q1 += kai.Length;
    q2 = zong.IndexOf(guan, q1);
    urlxxx=zong.Substring(q1, q2 - q1);
    }
    catch
    {
    urlxxx="无法读取" ;

    }
    return urlxxx; 
    }string ddd=caijiclass(0,0,开始字符,关闭字符,总字符);