xml中的字符引用 也叫作字符实体或编号实体,例如我们可以
&//显示一个and符号——& 也可以 & //也是显示一个and符号——& 第二种方式就叫做编号实体,在xml规范中定义了5个实体: <!ENTITY quot """>
<!ENTITY amp "&">
<!ENTITY apos "'">
<!ENTITY lt "&#60;">
<!ENTITY gt ">"> 我们可以通过名称quot、amp……来引用,也可以通过数字34、38……来引用。平时常用的(定义在HTML中的)实体还有: <!ENTITY nbsp " "> <!-- 不折行空格 -->
<!ENTITY copy "©"> <!-- 版权符号 --> 我的问题是,在dom4j 使用SAXReader解析xml文档时,其中的字符实体 、©都会变成问号——?,理论上来说 这里的数字(160、169)是字符在编码表中的(十进制)编码值,我给SAXReader设置的encoding是utf-8,难道unicode中没有160、169这两个值?不知道大家是否有遇到这样的问题,有没有什么解决方法或思路?
&//显示一个and符号——& 也可以 & //也是显示一个and符号——& 第二种方式就叫做编号实体,在xml规范中定义了5个实体: <!ENTITY quot """>
<!ENTITY amp "&">
<!ENTITY apos "'">
<!ENTITY lt "&#60;">
<!ENTITY gt ">"> 我们可以通过名称quot、amp……来引用,也可以通过数字34、38……来引用。平时常用的(定义在HTML中的)实体还有: <!ENTITY nbsp " "> <!-- 不折行空格 -->
<!ENTITY copy "©"> <!-- 版权符号 --> 我的问题是,在dom4j 使用SAXReader解析xml文档时,其中的字符实体 、©都会变成问号——?,理论上来说 这里的数字(160、169)是字符在编码表中的(十进制)编码值,我给SAXReader设置的encoding是utf-8,难道unicode中没有160、169这两个值?不知道大家是否有遇到这样的问题,有没有什么解决方法或思路?
解决方案 »
- win 2003+tomcat域名配置问题
- 100分求翻译续
- 关于NetworkInterface.getNetworkInterfaces()的一个问题
- jbpm4中怎样用java得到decision节点表达式的值
- 当当网,淘宝网
- 超链接到之前的页面时,如何清除密码框的数据
- 用Java axis 部署的web service,其它语言怎么调用啊?
- 寻求应用Lucence针对不同结构表之间查询建立索引策略
- 60分求答案
- 使用notepad++编写的java程序里面有中文字符,编译通不过怎么解决?
- MYeclipse SPRING +hibernate DAO 问题
- dotcms用svn不能checkout ,急等
查一查dom4j的DTD檔的驗證看看默認的DTD規范只定義了五個。