(?<=<a href=")http([\w\W]*?)(?=")([\w\W]*?)</a>
以上这个正则表达式可以匹配所有以http:开头的链接
比如
http://abc.com/">网页快照</a>我的问题是,如何能够限制</a>前面的字符呢?例如:
http://abc.com/">旅游</a>
http://abc.com/"><em>旅游afdsaf</a>
http://abc.com/"><em>旅游,北京旅游afdsaf</a>就是说带旅游两个字的都提取,不带旅游两个字的都不要