本帖最后由 nbda1121440 于 2011-02-25 20:00:46 编辑

解决方案 »

  1.   

    是在字符串中的吧,正则应该是<a \s+ href \s* = \s* (" [^"]* "| [^\s>]* ) \s* ><a 一个或多个空白 href 任意个空白 = 任意个空白 (" 非"的任意个字符 " 或 非空白或>的任意个字符 ) 任意个空白>
    ()内的内容是用来匹配的应该是网址链接
    比如<a href="http://www.baidu.com">
      

  2.   

    匹配 HTML 中的 a 标签。
    <a\\s+href\\s*=\\s*(\"[^\"]*\"|[^\\s>]*)\\s*>
      ----    ----      ---------- --------
        1       2            3    4    5(1) \\s+ 其中 \s 表示的意思在 Pattern 类的 API 文档中可以找到,+ 表示可以出现 N 次(N > 0)
    (2) \\s* 其中的 * 表示可以出现 M 次(M >= 0)
    (3) \"[^\"]*\" 表示双引号开始和结束,当中的 [^\"] 表示除了引号之外其他的字符,后面加个 * 表示 0 个或者多个除了引号之外其他的字符
    (4) | 表示或者的意思,或者在分组范围内有效,具体分组的意思在这里就不解释了
    (5) [^\\s>]* 表示允许 0 个或者多个 \s 和 > 之外的字符这里的 | 表示匹配 \"[^\"]*\" 或者 [^\\s>]*你可以去看看这个帖子,在这个帖子中有一些关于正则表达式的资源:http://topic.csdn.net/u/20080306/17/f37a1818-3968-49b4-8f79-e5564486d63e.html