我将一个word文档转成xml,转换之后xml文档十分复杂,我想用C#提取文档中红色词组,部分xml内容如下:<w:sz w:val="24"/></w:rPr></w:pPr><w:r wsp:rsidRPr="00BF2E91"><w:rPr><w:rFonts w:hint="fareast"/><wx:font wx:val="宋体"/><w:b/><w:color w:val="FF0000"/><w:sz w:val="24"/></w:rPr><w:t>我想提取的内容</w:t></w:r></w:p><w:p wsp:rsidR="00E2526D" wsp:rsidRPr="00BF2E91" wsp:rsidRDefault="00E2526D" wsp:rsidP="00BF2E91"><w:pPr><w:adjustRightInd w:val="off"/><w:snapToGrid w:val="off"/><w:spacing w:line="360" w:line-rule="auto"/><w:ind w:first-line-chars="200"/><w:rPr><w:sz w:val="24"/></w:rPr></w:pPr><w:r wsp:rsidRPr="00BF2E91"><w:rPr><w:rFonts w:hint="fareast"/><w:sz w:val="24"/></w:rPr><w:t>2008-6-27 08</w:t></w:r><w:r wsp:rsidRPr="00BF2E91"><w:rPr><w:rFonts w:hint="fareast"/><wx:font wx:val="宋体"/>
应该怎么做呢?小弟xml不是很了解~~望大虾指点~~~
应该怎么做呢?小弟xml不是很了解~~望大虾指点~~~
解决方案 »
- 求一个正则表达式,获取tb里的值
- 关于RadioButton的问题!望高手解惑!
- winform中如何打开局域网内别的电脑上的文件
- 求一正则表达式
- 用__doPostBack('Button1','');来执行BUTTON1的事件为什么不执行
- ModalPopupExtender的postback问题,急急急急急急急,在线等[问题点数:40分]
- 为什么我的MailMessage类中不提供 Fields 项?
- 在C#里面模糊查询结果怎么不对呢?
- datagrid问题!如何将其中一列(decimal)格式显示为货币形如:“¥1213.98”?
- 如何在程序中实现.net中那样风格的菜单??
- 关于 TextBox TAB 键的问题
- 请教一条正则表达式
整理下重新发出来吧.那样才好帮你
System.Text.RegularExpressions.Regex.Replace(this.richTextBox1.Text, "<\\w*>|</\\w*>", "");
http://topic.csdn.net/u/20081024/00/200484df-bf81-4449-8c63-2ba0cac07a56.html
19楼代码,你的这个xml代码好像格式不合规范
<?xml version="1.0" encoding="utf-8" ?>
<w:sz w:val="24" /> </w:rPr> </w:pPr> <w:r wsp:rsidRPr="00BF2E91">
<w:rPr>
<w:rFonts w:hint="fareast" />
<wx:font wx:val="宋体" />
<w:b />
<w:color w:val="FF0000" />
<w:sz w:val="24" />
</w:rPr>
<w:t>我想提取的内容 </w:t>
</w:r> </w:p> <w:p wsp:rsidR="00E2526D" wsp:rsidRPr="00BF2E91" wsp:rsidRDefault="00E2526D" wsp:rsidP="00BF2E91">
<w:pPr>
<w:adjustRightInd w:val="off" />
<w:snapToGrid w:val="off" />
<w:spacing w:line="360" w:line-rule="auto" />
<w:ind w:first-line-chars="200" />
<w:rPr>
<w:sz w:val="24" />
</w:rPr>
</w:pPr>
<w:r wsp:rsidRPr="00BF2E91">
<w:rPr>
<w:rFonts w:hint="fareast" />
<w:sz w:val="24" />
</w:rPr>
<w:t>2008-6-27 08 </w:t>
</w:r>
<w:r wsp:rsidRPr="00BF2E91">
<w:rPr>
<w:rFonts w:hint="fareast" />
<wx:font wx:val="宋体" />
你这个XML文件存在格式问题,我重新给你举个例子吧(这是今天CSDN某个帖子的XML内容,姑且将此XML文件命名为XMLTest.xml):
<?xml version="1.0" encoding="utf-8" standalone="yes" ?>
<ShellOrder>
<OneRM>
<Sender>Shell </Sender>
<Quantity>3 </Quantity>
<Unit>
<CompName>RIY-L-99971 </CompName>
<JoinDomain>No </JoinDomain>
<AdminPW>g6XHr8p2BCb5v3 </AdminPW>
</Unit>
<Unit>
<CompName>PPP-L-99972 </CompName>
<JoinDomain>No </JoinDomain>
<AdminPW>g6XHr8p2BCb5v4 </AdminPW>
</Unit>
<Unit>
<CompName>XXX-L-99973 </CompName>
<JoinDomain>No </JoinDomain>
<AdminPW>g6XHr8p2BCb5v5 </AdminPW>
</Unit>
</OneRM>
<OneRM>
<Sender>Shell </Sender>
<Quantity>2 </Quantity>
<Unit>
<CompName>SLMBCA-L-99998 </CompName>
<JoinDomain>No </JoinDomain>
<AdminPW>Kb9a5G2Uhp6ADx </AdminPW>
</Unit>
<Unit>
<CompName>SDFSD-L-99998 </CompName>
<JoinDomain>No </JoinDomain>
<AdminPW>Sd9a5G2Uhp6ADx </AdminPW>
</Unit>
</OneRM>
<OneRM>
<Sender>Shell </Sender>
<Quantity>1 </Quantity>
<Unit>
<CompName>RIY-L-99974 </CompName>
<JoinDomain>No </JoinDomain>
<AdminPW>g6XHr8p2BCb5v3 </AdminPW>
</Unit>
</OneRM>
</ShellOrder> 现在我要取所有<CompName>节点的内容(类似于你要取<W:t>的内容):
string result=string.Empty;
XmlDocument xmlDoc=new XmlDocument();
xmlDoc.Load("XMLTest.xml");
XmlNodeList xmlList = xmlDoc.GetElementsByTagName("CompName");
foreach(XmlNode xnf in xmlList)
{
result += xnf.InnerText + "\r\n";
}
执行代码后,结果如下:
RIY-L-99971
PPP-L-99972
XXX-L-99973
SLMBCA-L-99998
SDFSD-L-99998
RIY-L-99974