str= "<span id='pageLocation'>&gt;&nbsp;<a href="menu_1.html" title="关于我们">关于我们</a>&nbsp;&gt;</span>"或者str= "<span id='pageLocation'>&gt;&nbsp;<a href="products.html" title="产品中心">产品中心</a>&nbsp;&gt;</span>"
之类的。求一下js正则,清除HTML。提取“关于我们”或“产品中心”
感谢。

解决方案 »

  1.   

    string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档 
    上面就是清除所以html标签
      

  2.   

      <a href="" value="value的值" onclick="fnhref()" id="href">测试</a> function fnhref()
     {
    var href=document.getElementById("href").value;
    alert(href);
     }
    这样可以提取value的值
     
      

  3.   

    +1,直接提取value不就结了嘛?干吗用正则表达式?哈哈
      

  4.   

    public class SubStr {
        public static void main(String args[]) {
            String str= "<span id='pageLocation'>&gt;&nbsp;<a href=\"products.html\" title=\"产品中心\">产品中心</a>&nbsp;&gt;</span>";
            StringBuffer sb = new StringBuffer(str);
            sb.delete(0, sb.indexOf("\">") + 2);
            sb.delete(sb.indexOf("</a>"), sb.length());
            String name = sb.toString();
            System.out.println("name: " + name);
        }
    }
      

  5.   

    1.根据所解析html特征,自己处理。
    2.java方法,下jsoup包,里面有text()方法。