http://feedback.ebay.com/ws/eBayISAPI.dll?ViewFeedback2&ftab=AllFeedback&userid=paragad&iid=-1&de=off&items=25&interval=0&mPg=151
我要筛选获取到这个网站上面的这个模块下面的所有评论内容,比如:Told item was not in stock after I paid - refund room far too long. Poor seller!和very fast delivery. Thank you guys for awesome Service和Top seller, fast and top product. Thanks!和Fast postage, great item. A very good seller和Good等这些内容,正则表达是怎么写呀???求懂正则表达式的帮忙呀感激不尽...正则表达式C#

解决方案 »

  1.   

    string pattern = @"(?is)(?<=</td><td>)[^<>]+(?=</td><td\s*nowrap=""nowrap"")";
      

  2.   

    我要动态获取到http://feedback.ebay.com/ws/eBayISAPI.dll?ViewFeedback2&ftab=AllFeedback&userid=paragad&iid=-1&de=off&items=25&interval=0&mPg=151这个网站有多少页怎么获取呀?因为这个网站上面每天都会更新数据,页数在不断变化,我想动态获取它有多少页,怎么获取呀?是使用正则表达式吗?
      

  3.   

    正则使很扯淡的。随便举一个基本概念,在html中,你写<td>或者<td >或者<td style=....>等等,都是td。你连“语法分析”跟“此法匹配”都分不清楚,还怎么分析网页结构?最近是不是哪一个培训学校新开班了,你们的老师坑学生而给你们布置了这个“项目”了?csdn上可不是培训班啊,我们可以免费滴点出这种培训课程的问题,而不会胡乱地为了钱而忽悠学生。
      

  4.   

    人家要是写 <td draf='nowrap="nowrap"' class='td1'> 你就不认识了么?要分析一个网页,你得写多少不靠谱的“正则”啊?!
      

  5.   

    再比如说我写 <td expression="12pies > 10angs" style='td1'> 你说你是怎么识别的?当你分析网页语法结构是,纠结在正则,就好像是一个建筑设计师纠结在“楼字有多少种写法”一样,既不能自动地适应网页html的经常变化,而且从编程内容上一眼就能看出是完全在浪费编程时间。
      

  6.   

    http://feedback.ebay.com/ws/eBayISAPI.dll?ViewFeedback2&ftab=AllFeedback&userid=paragad&iid=-1&de=off&items=25&interval=0&mPg=151
    我只想获取到这个网站上面有共多少页你有好的方法吗???
      

  7.   

    比如说你这个网页的源代码上面有<span>of 153</span>这个字样,很显然这个153就是总共的页数了
    你获取到网页的代码之后
    string s = "网页源代码";
                s = s.Substring(s.IndexOf("<span>of ") + "<span>of ".Length);
                s = s.Substring(0, s.IndexOf("</span>"));这样最后s的结果就是那个153,也就是总共有多少网页了
      

  8.   

    引用HtmlAgilityPack
                HtmlWeb html = new HtmlWeb();
                var query = from pages in html.Load("http://feedback.ebay.com/ws/eBayISAPI.dll?ViewFeedback2&ftab=AllFeedback&userid=paragad&iid=-1&de=off&items=25&interval=0&mPg=151").DocumentNode.SelectNodes("//span[@class='pg-cw']")
                            let p = pages.Elements("span").LastOrDefault()
                            where p != null
                            select new
                                {
                                    content = p.InnerText
                                };
                Console.WriteLine(query.FirstOrDefault().content);
                Console.Read();