这几天我一直在问正则的问题,因为我自己不会啊,好了,我直奔主题吧。
我通过正则表达式取出我的连接地址,格式如:/article/2010/1203/article_21711.html。现在我输入一个关键字,取出所有包含这个关键字的标题的链接地址,但有时会出现重复的链接地址,用什么方法或者正则可以取到重复的链接地址呢?

解决方案 »

  1.   

     for (int i = 0; i < Matches.Count ; i++)   
                {
                     result = Matches[i].Value;
                     c = Get_Http(TextBox1.Text + result, "utf-8", out flag);
                }
    没有存放在一个列表中,这个待会我会改,这是我的语句,result 就是我去的链接地址。
      

  2.   

    对了,我还有一个问题
    如我输入:地棕榈油交易,点击确定,就可以得到=/comm/content/continfo.asp?Number=201012021826458
    html语言<a href="/comm/content/continfo.asp?Number=201012021826458" target="_blank">
    国内各地棕榈油交易日报(12月2日)
    </a>
      

  3.   

    昨天基础上,表达式最前面加模式修饰(?is)例如
    (?si)(?<=<a[^>]+?href=(['"]?))[^'"\s]+(?=\1[^>]*>((?!</a).)*?地棕榈油交易.*?</a>)
      

  4.   

    <a href="/article/2010/1203/article_21697.html" title="市场聚焦30万吨临储大豆抛售"  target="_blank">市场聚焦30万吨临储大豆抛售</a><a href="/comm/more/more.asp?Way=huasheng">花生及其产品</a><a title="大豆抛售" href="/article/2010/1203/article_21698.html"  target="_blank">大豆抛售</a>那如果像上面的三种格式的话,实现我说的功能,能用一个正则表示吗?