我想把下载到的网页源代码里面的<script></script>标记 ,href=javascript: (<a>) 属性 ,
控件的on...事件 ,
frame iframe frameset都去掉。
所以需要在String.replaceAll函数里用到正则表达式,希望大家帮我想想。
控件的on...事件 ,
frame iframe frameset都去掉。
所以需要在String.replaceAll函数里用到正则表达式,希望大家帮我想想。
控件的on...事件 ,
frame iframe frameset都去掉。
1.<script></script>-------------->(\\<script\\>[^\\<]*\\<\\/script\\>)
2.href="javascript:"--------------->\\<a\s(href\\=\\"javascript\\:[^\\"]+\\")[^\\>]+\\>
3.frame iframe frameset都去掉。(\\<frame[^\\>]+\\>|\\<iframe[^\\>]+\\>|\\<frameset[^\\>]+\\>)
3.frame iframe frameset都去掉。(\\<frame\\>[^\\>]+\\>|\\<iframe\\>[^\\>]+\\>|\\<frameset\\>[^\\>]+\\>)
给个简洁点的<(script)>.*?<\/\1> 其余类似...
(?s)<(script)>.*?<\/\1>