如:string NewsInfo = "<p>这是一段测试测试文字,在这里有一张图片<img src='http://www.abc/News/1.gif'></p>"<p>这是一段测试测试文字,在这里有一张图片<img src='http://www.abc/News/1.gif'></p>"
像上面这段文字,内容里不知道有多少图片文件,现在小弟求教,如何将内容中的图片的地址全部提取出来,并付给一个数组,在线等待,谢谢

解决方案 »

  1.   

    /// <summary>
    /// 取得HTML中所有图片的 URL。
    /// </summary>
    /// <param name="sHtmlText">HTML代码</param>
    /// <returns>图片的URL列表</returns>
    public static string[] GetHtmlImageUrlList(string sHtmlText)
    {
    // 定义正则表达式用来匹配 img 标签
    Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);// 搜索匹配的字符串
    MatchCollection matches = regImg.Matches(sHtmlText);int i = 0;
    string[] sUrlList = new string[matches.Count];// 取得匹配项列表
    foreach (Match match in matches)
    sUrlList[i++] = match.Groups["imgUrl"].Value;return sUrlList;
    }