各位高手:
  现我要在一个网页头代码中,并将其所有<noscript>到</noscript>之间的内容删除,请问各位:它的正则式怎么写呀?请大家不吝赐教,先谢谢了。

解决方案 »

  1.   

    <noscript>.*?</noscript>
    ----------------------------
    哈,不确信,有点忘记了!
      

  2.   

    不是,我写的太简单了,应该是从<noscript id = "mypage">到</noscript>的内容,当网页头代码中有两个,或更多的时候,需要把它们都找出来。
      

  3.   

    <(noscript)[^>]*>(.*?)</\1>
    这个可以把多个都找到,但是如果嵌套就不行。具体编程见相关的参考。
    <noscript id = "mypage">到</noscript>
    \1: noscript
    \2: 到
      

  4.   

    ^[<noscript][\s\S]*[</noscript>]$
      

  5.   

    修正:
    <noscript((.|\n)+?)</noscript>
      

  6.   

    <noscript>((.|\n)+?)</noscript>
    但要注意,用正则的局限性很大,如果你的页面格式只是<noscript>...</noscript>这样的话,还是采用直接手工分析页面好些。