深入解析XML中的字符实体与字符数据

   2016-03-06 0
核心提示:这篇文章主要介绍了XML中的字符实体与字符数据,文中所说的CDATA片段即是指字符数据即不由解析器解析的文本块,需要的朋友可以参考下

字符实体
在我们了解字符实体之前,先了解一下什么是 XML 实体。

W3 联盟 对实体的定义:文档实体作为实体树的根元素和 XML 处理程序的起点。


这意味着实体就是 XML 中的占位符。它们可以声明在文档序言或者DTD中。实体有不同的类型,本章后面会讨论字符实体。

HTML 和 XML 都有一些符号被保留使用,它们不能在 XML 代码中用作内容。例如,< 和 > 符号被用作 XML 标签的开头和结尾。要显示这些特殊字符,就要使用字符实体。

有些特殊的字符或符号还不能直接使用键盘输入。可以使用字符实体来显示这些符号或特殊字符。

字符实体类型
有三种类型的字符实体:

预定义的字符实体。
编码字符实体。
命名字符实体。
预定义的字符实体

引入它们是为了避免使用某些有歧义的符号。例如,当我们把小于(<)或大于(>)符号当尖括号(<>)使用时就会产生歧义。字符实体从根本上来说就是用来界定 XML 标签的。下面是一个来自 XML 规范的预定义字符实体列表。它们可以用来表示某些字符而不带歧义。

和号: &
单引号: '
大于: >
小于: <
双引号: "
数字字符实体

数字引用被用来表示字符实体。数字引用可以是十进制或十六进制格式。由于有数以千记的数字引用,导致很难记住它们。数字引用通过使用字符在 Unicode 字符集中的编码数值来表示。

十进制数字引用基本语法:

XML/HTML Code复制内容到剪贴板
  1. &# decimal number ;  

十六进制数字引用基本语法:

XML/HTML Code复制内容到剪贴板
  1. &#x Hexadecimal number ;  

下面的表格列出了一些预定义字符实体和它们对应的数值:

实体名称 字符 十进制引用 十六进制引用
quot " &#34; &#x22;
amp & &#38; &#x26;
apos ' &#39; &#x27;
lt &#60; &#x3C;
gt > &#62; &#x3E;

命名字符实体

正如上面所说的,数值字符很难记住,最受欢迎的字符实体类型是命名字符实体。因为每个实体都用一个名称标识。

例如:

'Aacute' 表示带重音符的大写 A 字符。
'ugrave' 表示带沉音符的小写 u。


CDATA 片段
术语 CDATA 就是字符数据。CDATA 被定义为不由解析器解析的文本块,但它被公认为标记。

标记中预定义的实体比如 &lt;,&gt; 和 &amp; 需要手动输入并且通常难以阅读。这种情况下就可以使用 CDATA 片段。通过使用 CDATA 片段,我们可以告诉解析器文档的特定部分不包含标记,应该被当做普通文本对待。

语法
下面是 CDATA 片段的语法:

XML/HTML Code复制内容到剪贴板
  1. <![CDATA[  
  2. characters with markup  
  3. ]]>  

上面的语法由三个部分组成:

CDATA 开始部分 - CDATA 以9个字符的分隔符<![CDATA[开头。
CDATA 结束部分 - CDATA 以 ]]> 分隔符结尾。
CData 部分 - 上面这两个标记之间的字符被解释为字符而不是标记。这个部分可以包含标记字符(<,> 和 &),但是它们会被 XML 处理程序忽略。
示例

下面的标记代码展示了 CDATA。其中写在 CDATA 片段中的字符都会被解析器忽略。

XML/HTML Code复制内容到剪贴板
  1. <script>  
  2. <![CDATA[   
  3. <message> Welcome to TutorialsPoint </message>  
  4. ]] >  
  5. </script>  

在上述的语法中,<message> 和 </message> 之间的所有内容都会被当做字符数据而不是标记。

CDATA 规则
XML CDATA 需要遵循以下规则:

XML 文档任何位置的 CDATA 都不能包含 "]]>" 字符。
CDATA 片段不可以嵌套。

 
反对 0举报 0 评论 0
 

免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

  • JavaScript的XMLHttpRequest对象
    ajax的核心技术是XMLHttpRequest对象,简称XHR。//支持IE7及更高的版本function createXML(){if(typeof XMLHttpReqquest!="undefined"){return new XMLHttpRequest();}else if(typeof ActiveXObject!="undefined"){if(typeof arguments.callee.activeXString!
    03-08
  • DOM,html,JavaScript,xml,CSS,浏览器之间的关系
    DOM,html,JavaScript,xml,CSS,浏览器之间
    DOM树解释:W3C所制订的DOM Level分为两大模块:Core和HTML。1.Core核心,W3C规范:满足软件开发者和Web脚本编写者,访问和操控产品项目中包含的可解析的HTML和XML内容。2.HTML模块,规范描述为:HTML之中特定元素的功能,和恰到好处的、易用的、针对常见性任
    03-08
  • 响应消息的内容类型 text/html; charset=utf-8
    问题表述:响应消息的内容类型 text/html; charset=utf-8 与绑定(application/soap+xml; charset=utf-8)的内容类型不匹配。 说明:此类问题当请求内容与响应消息内容不一致时发生。特别地,如果在站点错误描述中出现这个说明,一般代表站点后台自身的网络访
    03-08
  • jquery-easyui:格式化列 js格式化xml
    主框架页面: 在主界面区会加载西区菜单点击的URL内容. !DOCTYPE htmlhtmlheadmeta charset="UTF-8"/title主界面/titlediv th:include="/public/util::public"/div th:include="/public/util::jquery-easyui"/script type="text/javascript" th:src="(${@
    03-08
  • javascript读取XML
    2006-09-22 09:39 作者: 出处: 天极网   我的xml文件Login.xml如下.?xml version="1.0" encoding="utf-8" ?Login    Character        C Text="热血" Value="0"/C        C Text="弱气" Value="1"/C        C Text="
    03-08
  • XML与HTML的区别
    一、HTML       HTML(HyperTextMark-upLanguage)即超文本标记语言,是WWW的描述语言。  二、XML       XML即ExtentsibleMarkup Language(可扩展标记语言),是用来定义其它语言的一种元语言,其前身是SGML(标准通用标记语言)。它没有标签集(tagset),
    03-08
  • 一个xml转html的小程序 别人一个毕业设计【难度
    本来想5分钟写写发过去了。。发现机子上就一个vs2003 没办法用 1.1的来写一个吧。。每次都是从新google下。。这次也不例外。。奶奶的。。发现竟是2.0的代码。。无奈。自己摸索了下。。搞了10分钟写了点代码。。部分源码如下(最下面提供代码下载):---------
    03-08
  • 直接用mysql输出xml或html语句
    mysql -uroot -proot -Hc:/sql.sqlc:/data.html;mysql -uroot -proot -Xc:/sql.sqlc:/data.xml;在sql.sql中写入批处理命令,既可导出xml或html数据
    02-08
  • 微信小程序 - WXML语法与HTML比较
    上章我们看到一个小程序的page是由 .wxml  .wxss  .js  .json组成。wxml:相当于html,开发小程序的页面wxss:相当于css,小程序页面渲染样式js:实现小程序的动态方法等,包括该page的生命周期函数等json:用于小程序的配置如果你已经很熟练掌握Html,那
    02-08
  • 调用Web Service服务出现响应消息的内容类型tex
         错误信息:响应消息的内容类型 text/html; charset=utf-8 与绑定(text/xml; charset=utf-8)的内容类型不匹配。如果使用自定义编码器,请确保正确实现 IsContentTypeSupported 方法。    今天小姚给客户做远程的时候出现这问题,第一感觉应该是配
    02-08
点击排行