我将html转化为txt的同时,去除了<>之间的内容,使页面上的内容看起来清晰。
但是网页源代码中的javascript的内容还在,请问怎么去除?

解决方案 »

  1.   

    就象你去除<>之间的内容一样,你可以用同样的方法去除<script>和</script>之间的内容.
      

  2.   

    因为<script xxxxxx>,每个网页都不一样啊。
      

  3.   

    那就先定位<script,然后寻找后面的>,再截掉这一段不就行了
      

  4.   

    用pos(str1,str2)函数分别去定位"<script"、">"的位置,然后替换
      

  5.   

    要视楼主的具体要求而定如果只是去掉<>中的内容,那么可以进行匹配查寻,即当遇到一个“<”符号时,记下其位置,然后一直到“>”,再记下其位置,之后就可以把这之间的内容作处理但如果要对HTML作解释那又是另外一回事了