谁能帮我解释一下这个正则表达式吗?有点看不懂! "href=\"?(.*?)(\"|>|\\s+)"是提取html里的网页的,但是分组有点奇怪啊! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 1.href=2."?指"可有可无3.(.*?)指随便一组字符4.(\" ¦> ¦\\s+)指3上面那组字符跟着"|>|;\\s+表示一个或多个分隔符 以“開頭+任何東西+”或>+任何東西(小s)+“大s的話是任何非空的東西大概哦~ 第一个分组是任意串第二个分组或是引号或是大于号或一串White Spaces 这个可以匹配 href 中带引号和不带引号的地址(\"|>|\\s+)地址可以以引号、> 和空格作为结束,即可以匹配:引号结束:<a href="www.google.com">括号结束:<a href=www.google.com>空格结束:<a href=www.google.com target="_blank">但是这个也能匹配:<a href="www.google.com><a href=www.google.com">这种不符合规范的格式。 第二个分组不需要被捕获,建议改成非捕获组格式:href=\"?(.*?)(?:\"|>|\\s+) "href=\"?(.*?)(\" ¦> ¦\\s+)" 把它拆开\"? 匹配"的 但是可以有也可以没有,”\“是个 转译符(.*?) 是匹配除了”\n“(回车)之外的所有字符,不论多少个字符(\" ¦> ¦\\s+) 其中¦是或者的意思,匹配 " 或者 > 或者 空格、制表符、换页符等等例子4楼都已经举了参考 http://blog.csdn.net/kevinsin/archive/2005/04/21/356861.aspx poi读取excel 如何对一个doc文档分流 100求测试String线程不安全的测试程序 有哪位朋友用过j2me Polish?能不能帮帮我,谢谢了~ JdbTable里的列头字体改变后,为什么行的序号变成三个点? 急,blob中的内容如何显示 怎样才能让applet小程序在IE中执行 请告知广州哪间公司招聘java 程序员? 关于APPLET安全问题[求助] j2由问题么? 自己写的一个Java截屏组件 关闭DB连接的问题,请指教!
2."?指"可有可无
3.(.*?)指随便一组字符
4.(\" ¦> ¦\\s+)指3上面那组字符跟着"|>|;\\s+表示一个或多个分隔符
大s的話是任何非空的東西大概哦~
第二个分组或是引号或是大于号或一串White Spaces
括号结束:<a href=www.google.com>
空格结束:<a href=www.google.com target="_blank">但是这个也能匹配:<a href="www.google.com>
<a href=www.google.com">这种不符合规范的格式。
把它拆开
\"? 匹配"的 但是可以有也可以没有,”\“是个 转译符
(.*?) 是匹配除了”\n“(回车)之外的所有字符,不论多少个字符
(\" ¦> ¦\\s+) 其中¦是或者的意思,匹配 " 或者 > 或者 空格、制表符、换页符等等例子4楼都已经举了
参考 http://blog.csdn.net/kevinsin/archive/2005/04/21/356861.aspx