这是淘宝一个图片中的相关信息,怎么把<p>  </p>里的相关信息提取出来,存到数据库

解决方案 »

  1.   

    <li> 
           <div class="pic"> 
           <a href="/detail.htm?cat=1512&amp;spuid=139844292" target="_blank"><img data-ks-lazyload="http://img.taobaocdn.com/bao/uploaded/i1/T1BECHXiVnXXcLlAja_121701.jpg_250x250.jpg" alt="" /></a> 
     

           </div> 
              <div class="title"> 
             <p><a href="/detail.htm?cat=1512&amp;spuid=139844292">Samsung/三星 i8150/GALAXY W</a></p> 
             <p> 

                        <font>约</font><span>¥<em>2026</em></span>    
        
    (周销量 416件)</p> 
              </div> 
           <div class="message"> 
                <div class="compare J_listCompare" data-spuid="139844292" >对比</div> 
    <p>ANDROID</p> 

    <p>3.7英寸</p> 

    <p>500万</p> 

    <p>800M</p> 

                    <p><a target="_blank" href="/detail.htm?cat=1512&amp;spuid=139844292#item-container"><span>1829</span>家店铺在售</a>&nbsp;&nbsp;&nbsp;<a target="_blank" href="/detail.htm?cat=1512&amp;spuid=139844292">评论数<span>157</span>条</a></p> 
           </div> 
           </li> 
      

  2.   

    Samsung/三星 i8150/GALAXY W
    ¥2026
    ANDROID
    3.7英寸
    500万
    800M
      

  3.   

    jquery 遍历取值 然后处理 $("p").each(function(){})
      

  4.   

    正则表达式
    引入命名空间
    using System.Text.RegularExpressions;
    (?is)<p>(<(\w+)[^>]*?>)?(.*?)(</\1>)?\s*</p>取第二个分组,Groups[3].Value