html代码如下,想取出包含“求购”字段的href值和text值,
即得到“[求购]长期收购库存棉布、针织布、牛仔布、印花布、”和“http://www.apparelsos.com/Quotient/2008/0530/511134489879.html”<table width=100% border=0  cellpadding=0 cellspacing=0>
<tr>
<td width=655 style=padding:5px; line-height:1.4 >
<span><a class=T href='http://www.apparelsos.com/Quotient/2008/0530/511134489879.html' target=_blank>[求购]长期收购库存棉布、针织布、牛仔布、印花布、<font color='#DB2F35'><font color='#DB2F35'>灯芯绒</font></font></a></span><br>
<span class=style11>         我公司面向省内外服装厂家、纺织企业大量回收各种库存多年的布料(棉布、针织布、
梭织布、牛仔布、印花布、格仔布、提花布、缎纹布、花纤布、<font color='#DB2F35'><font color='#DB2F35'>灯芯绒</font></font>、斜纹布、平纹布、罗纹布、双面布、色丁布、毛料、里布、网布、 </span><br>
<span class=style13>http://www.apparelsos.com/Quotient/2008/0530/511134489879.html&nbsp;2008-06-16 13:16:46</span>
<td style='padding:5px;'></td>
</tr>
<table>

解决方案 »

  1.   

    如果是用WebBrowser我知道怎么做。例如
    WebBrowser.GetElementsByTagName("table")[3].GetElementsByTagName("TH")[0].OuterText
    就可以得到
      

  2.   

    <a\s+.*?href='(?<href>[^']*)'[^>]*?>\s*\[(?<text>)[^\]]*)\]
    下次干脆不要给分了
      

  3.   

    using System;
    using System.Collections.Generic;
    using System.ComponentModel;
    using System.Data;
    using System.Drawing;
    using System.Text;
    using System.Windows.Forms;namespace WindowsApplication6
    {
        public partial class Form1 : Form
        {
            public Form1()
            {
                InitializeComponent();
            }        private void Form1_Load(object sender, EventArgs e)
            {
                this.webBrowser1.Navigate("d:\\1.html");
            }        private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
            {
                if (this.webBrowser1.Document != null)
                {
                    
                    HtmlElementCollection elemColl = null;
                    HtmlDocument doc = this.webBrowser1.Document;
                    if (doc != null)
                    {
                        elemColl = doc.GetElementsByTagName("table")[0].GetElementsByTagName("a");
                        if (elemColl != null)
                        {
                            for (int i = 0; i < elemColl.Count; i++)
                            {
                                this.textBox1.Text += elemColl[i].OuterText+"\r\n";
                            }
                        }
                        else
                        {
                            MessageBox.Show("没有找到该地区的天气预报");
                        }
                        
                    }
                }
             }        
        }
    }
      

  4.   

    我发现现在哥们遇到解析Html的情况,首先想到的就是正则表达式,但是如果出现的是另外一种需求呢??那不每天写正则表达式吗?我一直在推荐一种解析html的方法,就是首先将Html解析成tag树,然后,你想怎么做都可以,完全抛开了正则,可谓一劳永逸啊。我在我的blog中已经详细地描述了这种方法,并且给出了核心算法,和主要代码。我相信每个好好研究的都能够很好地实现它。哎:只能当消防队员了http://blog.csdn.net/RonoTian/archive/2008/06/06/2517568.aspx