下面的是源码,我要获取下面5个内容
内容1 商品名称
内容2 生产厂家
内容3 商品产地
内容4 商品毛重
内容5 上架时间注意我要的是后面的值, 我不会写正则,但是工作需求没办法, 希望大家帮下忙, 在这里谢谢了!!<ul class='Detail1'><li class='w100'title='新贵(NEWMEN)小屁股 MP-201高级柔性护腕垫'>商品名称:新贵(NEWMEN)小屁股 MP-201高级柔性护腕垫</li><li>生产厂家:<a target="_blank" href="http://www.360buy.com/brand/%e6%96%b0%e8%b4%b5.html">新贵</a></li><li>商品产地:中国大陆</li><li>商品毛重:0.275千克</li><li>上架时间:2004-1-1 0:00:00</li><li>价格举报:如果您发现有比京东价格更低的,<a class="link_1" target="_blank" href="http://jd2008.360buy.com/user_jubao.aspx?id=100028" >欢迎举报... </a></li><li>信息纠错:如果您发现商品信息不准确,<a class="link_1" target="_blank" href="http://club.360buy.com/jdvote/skucheck.aspx?skuid=100028&cid1=670&cid2=686&cid3=826" >欢迎纠错... </a></li></ul>
内容1 商品名称
内容2 生产厂家
内容3 商品产地
内容4 商品毛重
内容5 上架时间注意我要的是后面的值, 我不会写正则,但是工作需求没办法, 希望大家帮下忙, 在这里谢谢了!!<ul class='Detail1'><li class='w100'title='新贵(NEWMEN)小屁股 MP-201高级柔性护腕垫'>商品名称:新贵(NEWMEN)小屁股 MP-201高级柔性护腕垫</li><li>生产厂家:<a target="_blank" href="http://www.360buy.com/brand/%e6%96%b0%e8%b4%b5.html">新贵</a></li><li>商品产地:中国大陆</li><li>商品毛重:0.275千克</li><li>上架时间:2004-1-1 0:00:00</li><li>价格举报:如果您发现有比京东价格更低的,<a class="link_1" target="_blank" href="http://jd2008.360buy.com/user_jubao.aspx?id=100028" >欢迎举报... </a></li><li>信息纠错:如果您发现商品信息不准确,<a class="link_1" target="_blank" href="http://club.360buy.com/jdvote/skucheck.aspx?skuid=100028&cid1=670&cid2=686&cid3=826" >欢迎纠错... </a></li></ul>
生产厂家:(.*?)<li>
商品产地:(.*?)<li>
商品毛重:(.*?)<li>
上架时间:(.*?)<li>
不过你的生产厂家要去除掉html元素:System.Text.RegularExpressions.Regex.Replace(textstring,"<[^>]+>","");
试下
System.Text.RegularExpressions.MatchCollection col = System.Text.RegularExpressions.Regex.Matches(strHtml, @"<li([^>]*)?>(商品名称|生产厂家|商品产地|商品毛重|上架时间):(\s+<[^>]*>)?([^<>]*)(</[^>]*>\s+)?</li>");
foreach (System.Text.RegularExpressions.Match matchEach in col)
{
Console.WriteLine(matchEach.Groups[4].Value);
}