问题是这样的,为了描述清楚些可能有点长,呵呵
我要处理一个xml文件,它的内容类似这样:
<text lang='eng'>
<body>
<head><pb n='132' ref='155' />HENRIOUS EHRENFRIED WARNEKROS,
<argument><foreign lang='Greek'>&#x03B1;&#x03C7;&#x03B8; &#x03B4;&#x03B3;Gp &#x03C7;&#x0374; &#x0376;</foreign>This is a paragraph for argument<lb /> ON THE Fertility of Palestine, AND ITS &acy; PRINCIPAL ADVANTAGES, COMPARED WITH THOSE OF EGYPT.
<byline>by <author>Author I</author> <author>Author II</author></byline>请注意的是里面的<foreign>标记,<foreign lang='Greek'>&#x03B1;&#x03C7;&#x03B8; &#x03B4;&#x03B3;Gp &#x03C7;&#x0374; &#x0376;</foreign>
他里面包含的是UNICODE码,客户需要根据这个xml文件来查错,也就是看foreign里的内容是否正确,她们(是她们哦,呵呵)希望我能将一个文件所有的foreign标记挑出来单独显示,并且显示的是转换后的字符(因为直接看&#x03C7;&#x0374;这些东西太麻烦而且不好认),即显示效果是这样<foreign>ΒΓΔΕ</foreign>
<foreign>ΑΒΓΔΖ</foreign>
<foreign>ΑΓΖ</foreign>
这种的,然后在旁边用listbox显示所有的UNICODE标记,她们如果发现什么地方有错误就选中然后替换。
我提问的主要问题有二:
一:如何根据unicode码显示相关字符
我试了一下,有些是可以显示的,比如ΑΒΓΔΕΖ之类,但多数无法正常显示;请指点
二:如何实现替换呢?
她们替换的是显示后的字符,我要在后台对相关的xml文件替换‘&#x03C7;’之类的东西,而且麻烦的是xml文件中不只是<foreign>标记,还有一些别的标记,我如何准确定位呢?
期待高手指点,谢谢!