网页中的部分代码如下:
--------------------------------------------
<div class="item">
    <div class="pic">
        <a href="http://item.taobao.com/item.htm?id=8280749820" target="_blank">
        <img src="http://img01.taobaocdn.com/bao/uploaded/i1/T1jU0QXelpXXXL6uk._112046.jpg_160x160.jpg">
         </a>
    </div>
    <div class="desc">
        <a target="_blank" href="http://item.taobao.com/item.htm?id=8280749820" class="permalink">
         2010秋冬新款保暖锥领长袖毛衣
        </a>
    </div></div>
-----------------------------------------------------
    我试了半天,无果,
    求图片地址和对应文字描述!

解决方案 »

  1.   

    (?is)<div class="item">.*?<img src="([^"]*)".*?<div class="desc">\s*<a[^>]*>([^<]*)结果取$1和$2
      

  2.   

    <img src="([\s\S]+?)">[\s\S]+?class="permalink">([\s\S]+?)</a>
      

  3.   

    <img src="(?<address>[^"]*).*?<a[^>]*>(?<title>.*?)</a>
      

  4.   

    (?is)<img.*?src=(['"]?)(?<url>[^'" ]+)(?=\1)[^>]*>[^>]*>([^>]*>){3}\s*([^<]+)分组3是文字
    分组4是图片地址
      

  5.   

        public static void Test()
        {
            string html = @"<div class=""item"">
      <div class=""pic"">
      <a href=""http://item.taobao.com/item.htm?id=8280749820"" target=""_blank"">
      <img src=""http://img01.taobaocdn.com/bao/uploaded/i1/T1jU0QXelpXXXL6uk._112046.jpg_160x160.jpg"">
      </a>
      </div>
      <div class=""desc"">
      <a target=""_blank"" href=""http://item.taobao.com/item.htm?id=8280749820"" class=""permalink"">
      2010秋冬新款保暖锥领长袖毛衣
      </a>
      </div></div>";
            Match m = Regex.Match(html, @"(?is)<img.*?src=(['""]?)(?<url>[^'"" ]+)(?=\1)[^>]*>[^>]*>([^>]*>){3}\s*([^<]+)");
            Console.WriteLine(m.Groups[3].Value);//m.Groups[3].Value是提示内容
            Console.WriteLine(m.Groups[4].Value);//m.Groups[4].Value是图片地址
        }