比如
原始文本为:
<table width="500" border="0" cellspacing="0" cellpadding="0">
<tr align="center">
<td valign="top" >百美公司 版权所有</td>
<hr>天下第一刀
</tr> </table> 希望显示为:百美公司 版权所有 天下第一刀
也就是把网页标志全部过滤掉
原始文本为:
<table width="500" border="0" cellspacing="0" cellpadding="0">
<tr align="center">
<td valign="top" >百美公司 版权所有</td>
<hr>天下第一刀
</tr> </table> 希望显示为:百美公司 版权所有 天下第一刀
也就是把网页标志全部过滤掉
解决方案 »
- 数组保存到本地电脑
- 关于不可显示字符的问题
- C#调用ORACLE存储过程出现 未执行语句句柄的错误
- 学了计算机网络之后该做些什么事情来巩固知识结构
- 请问该如何实现类似Visual studio中的解决方案资源管理器和属性那样的拖拽面板?
- FileUpload 控件的FileUpload1.FileName.ToString(); 怎么只取了文件名,整个路径怎么取?
- 求购绘工作流的程序,500分起
- "JavaScript"问题高分求解!
- 怎么调试网站代码
- 我想自己攒1台机器,用来家用和学习,比如学.net等,打算在4000—5500左右,请大家帮忙推荐一下给怎样配置?
- 请问在类里声明成员为private并设置get,set方法和直接将其声明为public有什么区别?
- 怎样用从SQL中将image字段保存的图片读出来?
>([^>]*)</取出Mach.Group(1)即得到文本,所有匹配的文本就是你最后得到的。
s = System.Text.RegularExpressions.Regex.Replace(s, @"<[^>]+>","");
比如关键字为 “Test”则将来显示时原始字串中包含“Test”的部分(html标志已成功过滤掉)替换为<font style='background-color:#ffff66'>Test</font>现在显示结果出来了!但是原来的Html格式都没有了!全部成了普通文本请问怎样再还原原来的格式 并将替换文本也加进去??
s = System.Text.RegularExpressions.Regex.Replace(s, @"<(?!/?script|\!--)[^>]+>","", RegexOptions.IgnoreCase);
我的作法是提取出文本,他的作法是替换调标签。使用s = System.Text.RegularExpressions.Regex.Replace(s, @"<(?!/?script|\!--)[^>]+>","", RegexOptions.IgnoreCase);
可以先把脚本去掉。
,然后提取文本,还是去处标签,你都能得到网页文本。