下面这一段是源文本:微软中国官方网站
微软中国官方网站为您提供微软的软件和服务、技术支持、安全与更新等信息,包括正版Microsoft Windows、Office、IE的下载、试用与验证等。...
www.microsoft.com/China/ 2011-11-30-快照-分享-预览
就是在搜索引擎上搜索出来的一个信息,我想问的就是咱们用正则表达式把标题“微软中国官方网站”和链接www.microsoft.com/China/筛选出来?(这两个东西要存到一个数据表的两个列里的,应该分别筛选吧?)我这只是举个例子,不是仅仅筛选“微软中国官方网站”这一个标题。一直搞不成啊!!!!还是知识储备不足啊!革命尚未成功,同志仍需努力。

解决方案 »

  1.   


    void Main()
    {
      string str = @"微软中国官方网站
    微软中国官方网站为您提供微软的软件和服务、技术支持、安全与更新等信息,包括正版Microsoft Windows、Office、IE的下载、试用与验证等。...
    www.microsoft.com/China/ 2011-11-30-快照-分享-预览
    ";
      foreach(Match m in Regex.Matches(str,@"(?is)(\w+).*?((https?://)?www\.\S+)"))
      {
       Console.WriteLine("Title: "+ m.Groups[1].Value);
       Console.WriteLine("URL: "+ m.Groups[2].Value);
      }
      
      /*
    Title: 微软中国官方网站
    URL: www.microsoft.com/China/
      */
    }
      

  2.   

    标题有很多行,而且网址不一定带WWW。不过你后面提供的代码有时候还是能用的,起码我能有点头绪了,谢谢了!