我在CS结构中获得了网页的Html代码,现在想从此代码中取得标签<Body></body>之间的值.
想请问一下,怎样写一个正则表达式来匹配呢?我原来是这样的:<body \S*>\S*</body>  但是不能取出来。请高手帮忙,不胜感激!

解决方案 »

  1.   

    <body>\w*\s*\W*\S*</body>其实如果是这么简单,不一定能够用正则表达式,直接使用Indexof 和lastIndexof会不会更好
      

  2.   


    <body>.*</body> 可行;koenemy() 给的那个估计是<body >中空格的原因,fantasylu(fantasy) 给的这个:
    <body>\w*\s*\W*\S*</body>
    没有考虑字符顺序,应该加上  [] 
    改为:<body>[\w\s\W\S]*</body>
      

  3.   

    支持fantasylu(fantasy)的观点!
     同意lijiangchxp2005() 的观点!
      

  4.   

    <body>.*</body>
    我把空格去掉了,试了一下还是不行。<body>[\w\s\W\S]*</body>
    假如body里面有属性,这个表达式有用吗?
      

  5.   

    .* 看你正则属性multiline(好像是这个属性)需要设置,不然.是不匹配换行的。
      

  6.   

    用这个试试:<body.*?>[\f]*</body>
      

  7.   

    上面的不对,用这个<body.*?>[^\f]*</body>
      

  8.   

    我刚刚试了一下这个
    <body .*>(.|\n)*</body>
    好像也行的。
    谢谢大家帮助!