<h1><a title="情缘 ">dffdfdf </a></h1>江南佳丽地,金陵帝王洲。<BR></P><P>  这两句话虽好,却似乎仍不能摹尽金陵这片繁华地的金粉奢靡。然而,当你亲自去那秦淮河畔,领略那里的珠玑罗绮,画舸兰桡,却又实在想不出什么比那“佳丽地”,“帝王洲”更能描述这歌舞升平了。<BR></P><P>  此刻,便听那河上 </div>有一个完整的网页,我用正则<<h1><a title="(.*)></div>直接取出了上面这段文字,但是我想要的是"江南佳丽地,金陵帝王洲。<BR></P><P>  这两句话虽好,却似乎仍不能摹尽金陵这片繁华地的金粉奢靡。然而,当你亲自去那秦淮河畔,领略那里的珠玑罗绮,画舸兰桡,却又实在想不出什么比那“佳丽地”,“帝王洲”更能描述这歌舞升平了。<BR></P><P>  此刻,便听那河上 "这一部分,再用一次正则当然可以做到,但现在我希望仅仅只用一个正则表达式直接就从原始网页中取到这个内容(当然不能用</a></h1>(.*)</div),正则应该怎么写,请指教

解决方案 »

  1.   

    (?<=<h1>)(.*)(?=</div>)领分
      

  2.   

    (?<=</h1>)(.*)(?=</div>)
      

  3.   

    楼上误会我的意思了,(?<=</h1>)(.*)(?=</div>)是取不到我要的内容的,一个网页中符合这个正则的字符串有很多个,
    只能用 <h1> <a title="(.*)> </div>来取,但是取出来就是下面这个内容:
    <h1> <a title="情缘 ">dffdfdf </a> </h1>江南佳丽地,金陵帝王洲。 <BR> </P> <P>  这两句话虽好,却似乎仍不能摹尽金陵这片繁华地的金粉奢靡。然而,当你亲自去那秦淮河畔,领略那里的珠玑罗绮,画舸兰桡,却又实在想不出什么比那“佳丽地”,“帝王洲”更能描述这歌舞升平了。 <BR> </P> <P>  此刻,便听那河上 </div> 但是<h1> <a title="情缘 ">dffdfdf </a> </h1>这一部分是多余的,也就是还要一步才能取出我需要的部分,现在我想一步到位的直接取出
    江南佳丽地,金陵帝王洲。 <BR> </P> <P>  这两句话虽好,却似乎仍不能摹尽金陵这片繁华地的金粉奢靡。然而,当你亲自去那秦淮河畔,领略那里的珠玑罗绮,画舸兰桡,却又实在想不出什么比那“佳丽地”,“帝王洲”更能描述这歌舞升平了。 <BR> </P> <P>  此刻,便听那河上请教这个正则应该怎么写?
      

  4.   


    (?<=\<h1\><a\stitle=.*?>[^<>]*?\</a\>\</h1\>).*(?=\<div\>)这个应该可以。。
      

  5.   


    //修改一下,上面那个漏写了几个字符:
    (?<=\<h1\>\<a\stitle=.*?\>[^<>]*?\</a\>\</h1\>).*(?=\</div\>)
    //测试用例:
    <h1><a title="情缘 ">dffdfdf </a></h1>江南佳丽地,金陵帝王洲。 <BR> </P> <P>  这两句话虽好,却似乎仍不能摹尽金陵这片繁华地的金粉奢靡。然而,当你亲自去那秦淮河畔,领略那里的珠玑罗绮,画舸兰桡,却又实在想不出什么比那“佳丽地”,“帝王洲”更能描述这歌舞升平了。 <BR> </P> <P>  此刻,便听那河上 </div> //测试结果:
    江南佳丽地,金陵帝王洲。 <BR> </P> <P>  这两句话虽好,却似乎仍不能摹尽金陵这片繁华地的金粉奢靡。然而,当你亲自去那秦淮河畔,领略那里的珠玑罗绮,画舸兰桡,却又实在想不出什么比那“佳丽地”,“帝王洲”更能描述这歌舞升平了。 <BR> </P> <P>  此刻,便听那河上 
      

  6.   

    [Quote=引用 1 楼 nattystyle 的回复:]
    C# code(?<=<h1>)(.*)(?=</div>)