正则表达式如下:
(?<=href[^>]*>).*(?=< */a *>)我用它来获取<a href =*>text</a>之间的text值。
但是如果出现这种情况:
<a href="v1.0.xls" >form-v1.0</a> + <a href="form/eudc.xls">list</a>上面的表达式就会找错内容了,找出来的内容为:
form-v1.0</a> + <a href="form/eudc.xls">list请教····这个正则表达式的正确写法,谢谢。另外,这个正则表达式中 ?=< 难道是从右开始往左找的吗?

解决方案 »

  1.   

    <a.*?>([.\s\S]*?)</a>
    就可以了
      

  2.   

    又回来看了看。2楼给的方法可行,抱歉之前没有验证就说不行。
    另外还有个问题:
    我通过httpwebrequest获取的response的返回stream中,多余的空格我怎么去掉?
    我可以先从stream获取string,但是空格因为网站的代码被download下来之后,发现因为缩进导致string有部分地方出现多余的空格这个有办法解决么?残念啊残念!
      

  3.   

    Regex.Replace(value,"[ ]+"," ")