抓取关键字小程序:抓取到一个网页源码后怎样用正则提取出网页中指定的关键字

解决方案 »

  1.   

    不必用正则,推荐用HtmlAgilityPack第三方开源类库,用它的HtmlDocument类加载html文档,用XPath操作Dom,非常方便。只要你用过XmlDocument就能很快上手的。
    给你个参考链接:http://zzk.cnblogs.com/s?w=HtmlAgilityPack
      

  2.   

    网页源文件中的一行代码:
    <li ><span class="high bgh">5</span><a onMouseDown="return inpmv(1535);" title="行政办公管理工具大全" target="docin_p_end" href="/p-203398438.html" >行政办公管理工具大全</a></li>
    想用正则表达式把 “行政办公管理工具大全”匹配出来该怎样做?
      

  3.   

    用这个试试:
    (?<=<li[\s\S]*?><span[\s\S]+?</span><a[\s\S]+?>)\S+?(?=</a></li>)
      

  4.   

    vb通用字符串截取
    http://2e3.org/vb/1429/vb通用字符串截取
    本文来源于E动天下VB源码网 http://2e3.org/     原文地址:http://2e3.org/vb/1429/