<PDFPageNum>31</PDFPageNum>
<pageContent><![CDATA[然窃有忧者,则匪氛之起,不在满清末运,而在民国初年。何则?战后之兵,蛮野浮动,在伍时既大肆劫掠,退伍后仍将流为盗寇,则今日之兵,即他日之匪,其因一;愚民不识共和为何物,教育不克立收成效,责以国民义务,群警为苛法虐政,起而抗变,其因二;一度战乱,元气大丧,民间愁苦怨嗟,实为乱阶,其因三;左道之流18,造谣惑众,此次革命,引起此辈帝王思想,其因四。怅望前途,不寒而栗,黯黯中原,将沦为盗贼世界,吾民尚有噍类19耶!
以上三端,百思恐不获免。凡百君子,其有以嘉谋嘉猷20而弭于未然者乎?曷有以解我忧?
按:斯篇成于民国元年六月,迄今将及一纪,党争则日激日厉,省界亦愈划愈严。近宋案21发生,借款事起,南北几兴兵戎,生民险遭涂炭。人心诡诈,暗杀流行,国士元勋,人各恐怖,而九龙、龙华诸会匪,又复蠢蠢欲动,匪氛日益猖炽,环顾神州,危机万状。抚今思昔,斯文着笔时,犹是太平时也。呜呼!记者附识。
署名:李钊
《言治》月刊第1年第3期
1913年6月1日]]></pageContent>
</page>
这是一个XML的文本格式,我想把CDATA里面所有的数字注释删掉请问怎么写正则呢?
<pageContent><![CDATA[然窃有忧者,则匪氛之起,不在满清末运,而在民国初年。何则?战后之兵,蛮野浮动,在伍时既大肆劫掠,退伍后仍将流为盗寇,则今日之兵,即他日之匪,其因一;愚民不识共和为何物,教育不克立收成效,责以国民义务,群警为苛法虐政,起而抗变,其因二;一度战乱,元气大丧,民间愁苦怨嗟,实为乱阶,其因三;左道之流18,造谣惑众,此次革命,引起此辈帝王思想,其因四。怅望前途,不寒而栗,黯黯中原,将沦为盗贼世界,吾民尚有噍类19耶!
以上三端,百思恐不获免。凡百君子,其有以嘉谋嘉猷20而弭于未然者乎?曷有以解我忧?
按:斯篇成于民国元年六月,迄今将及一纪,党争则日激日厉,省界亦愈划愈严。近宋案21发生,借款事起,南北几兴兵戎,生民险遭涂炭。人心诡诈,暗杀流行,国士元勋,人各恐怖,而九龙、龙华诸会匪,又复蠢蠢欲动,匪氛日益猖炽,环顾神州,危机万状。抚今思昔,斯文着笔时,犹是太平时也。呜呼!记者附识。
署名:李钊
《言治》月刊第1年第3期
1913年6月1日]]></pageContent>
</page>
这是一个XML的文本格式,我想把CDATA里面所有的数字注释删掉请问怎么写正则呢?
解决方案 »
- 图片放大后显示在PictueBox,怎么获取左右没有显示出来部分的大小呢?
- 想用这个方法检查是否能正常联网,经常会操作超时,不知道为什么
- 如何取出Form中所有的ListBox?
- 【算法比赛】打印有变化规律的数字正方形,看谁的代码扩展性、可读性最好。
- 求 面向对象分析与设计(原书第2版)的电子版?
- treeview 高手请指教!
- 再一次请问我在一个datagrid1中又嵌套了一个datagrid2的问题
- 在C#的web应用程序中,如何做html中frame那样的分页效果
- 关于拦截系统关机并取消关机的操作
- [求教] C# 各个版本的新特性
- dictionary效率问题
- C# 结构体和数组转化问题
<pageContent><![CDATA[然窃有忧者,则匪氛之起,不在满清末运,而在民国初年。何则?战后之兵,蛮野浮动,在伍时既大肆劫掠,退伍后仍将流为盗寇,则今日之兵,即他日之匪,其因一;愚民不识共和为何物,教育不克立收成效,责以国民义务,群警为苛法虐政,起而抗变,其因二;一度战乱,元气大丧,民间愁苦怨嗟,实为乱阶,其因三;左道之流18,造谣惑众,此次革命,引起此辈帝王思想,其因四。怅望前途,不寒而栗,黯黯中原,将沦为盗贼世界,吾民尚有噍类19耶!
以上三端,百思恐不获免。凡百君子,其有以嘉谋嘉猷20而弭于未然者乎?曷有以解我忧?
按:斯篇成于民国元年六月,迄今将及一纪,党争则日激日厉,省界亦愈划愈严。近宋案21发生,借款事起,南北几兴兵戎,生民险遭涂炭。人心诡诈,暗杀流行,国士元勋,人各恐怖,而九龙、龙华诸会匪,又复蠢蠢欲动,匪氛日益猖炽,环顾神州,危机万状。抚今思昔,斯文着笔时,犹是太平时也。呜呼!记者附识。
署名:李钊
《言治》月刊第1年第3期
1913年6月1日]]></pageContent>
</page>";
string r = Regex.Replace(s, @"(?s)(?<=<!\[CDATA\[.*?)\d+(?=.*?\]\]>)", "");
Response.Write(Server.HtmlEncode(r));
tempStr = Regex.Replace(tempStr, @"(?<=<!\[CDATA\[[\s\S]*?)\d+(?=[\s\S]*\]\]>)", string.Empty);
这里边的数字也没有了
这里边的数字也没有了
<PDFPageNum>168</PDFPageNum>
<pageNum>141</pageNum>
<PDFPageNum>169</PDFPageNum>
时第一个数字保留了下来其他都被删掉了
如:
有多个<pageNum>140</pageNum>
<PDFPageNum>168</PDFPageNum>
<pageNum></pageNum>
<PDFPageNum></PDFPageNum>
变成这样了