怎样消除fck 的结果中的<div>....</div> html标签 。
要求:去掉后,输出到word后,样式基本不变,最基本的换行总有吧。只是去掉标签,已经实现【用正则表达式】,但是输出到word后格式却都是内容紧贴着,没有换行以及格式了
要求:去掉后,输出到word后,样式基本不变,最基本的换行总有吧。只是去掉标签,已经实现【用正则表达式】,但是输出到word后格式却都是内容紧贴着,没有换行以及格式了
解决方案 »
- 我在主窗体的 formclosing事件中询问用户是否退出,为什么这个询问会出现两次呢?
- 写过自己的webbrowser浏览的高手麻烦一下。
- C#动态创建button,如果显示在窗体上
- 字符串 调用remove方法 无效?
- 用WinForm生成了一个带SQL文件的程序,能在未装SQL的机器上运行吗?
- 如何在datagrid的表头上加入一个按钮
- 如何在.cs文件里面判断文本框的值是否数字,如果不是数字作出判断并返回!
- 提问:DataGridView 控件中至少有一列没有单元格模板
- ?TCP client无应答时程序明显变慢,有什么办法可以加速,谢谢
- [求助]FileStream 导致的文件被占用问题
- 懂HttpWebRequest的请进
- 如何 “用控件的名字获得对控件的引用”
Regex.Replace(str,@"<[^> ]+>","");
换行使用Enviroment.NewLine,\r\n替换标识
保存为HTML
{
string[] Regexs = {
@"<script[^>]*?>.*?</script>",
@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",
@"([\r\n])[\s]+",
@"&(quot|#34);",
@"&(amp|#38);",
@"&(lt|#60);",
@"&(gt|#62);",
@"&(nbsp|#160);",
@"&(iexcl|#161);",
@"&(cent|#162);",
@"&(pound|#163);",
@"&(copy|#169);",
@"&#(\d+);",
@"-->",
@"<!--.*\n"
}; string[] Replaces ={
"",
"",
"",
"\"",
"&",
"<",
">",
" ",
"\xa1", //chr(161),
"\xa2", //chr(162),
"\xa3", //chr(163),
"\xa9", //chr(169),
"",
"\r\n",
""
};
string s = HTML;
for (int i = 0; i < Regexs.Length; i++)
{
s = new Regex(Regexs[i], RegexOptions.Multiline | RegexOptions.IgnoreCase).Replace(s, Replaces[i]);
}
s.Replace("<", "");
s.Replace(">", "");
s.Replace("\r\n", "");
return s;
}
这是消除html标签的。但是消除后,内容全部连一块了。
String xx=Regex.Replace(源字符,@"<div[^>]*>([\s\S]*?)</div>","<p>$1</p>");