比如有链接形式
1<A href="http://XXX" target=blank>***</a>
2<A href='http://XXX'>***</a>
3<A href=http://XXX>***</a>
等等要求提取其中的http://XXX
我用的是VC7.1的正则,CAtlRegExp
跟Perl正则不太一样,在网上一直没找到合适的。

解决方案 »

  1.   

    用wget开放开发包来解析网页GNU Wget is a free software package for retrieving files using HTTP, HTTPS and FTP, the most widely-used Internet
      

  2.   

    即然perl的正则已经熟悉,那么再看一看VC的文档找出有差异的地方不是行了吗?
      

  3.   

    http://vckbase.com/document/viewdoc/?id=1196
      

  4.   

    昨天用java写了一个,提取href里面的内容,你看合适不
    String regex = "<\\s*a\\s+href=\"([^\"]+)\"";
      

  5.   

    直接找"A href"也可以啊
    稍微分析下字符串就可以出来了
      

  6.   

    结贴。汇报结果。装了一个boost,编译以后,不能与VC71一起编译。编译的时候出现错误。懒得找原因了。放弃。
    用CAtlRegExp,能够运行,但是经常出现莫名其妙的错误,不稳定,不知道是什么原因,难道是正则表达式的问题?对正则不熟。如thisisll所说,形式比简单,自己写了一个函数,识别起来,基本没什么问题。