深入解析XML中的DTD文档类型定义

   2016-03-06 0
核心提示:这篇文章主要介绍了XML中的DTD文档类型定义,是XML入门学习中的基础知识,需要的朋友可以参考下

XML 文档类型定义,俗称 DTD,它是一种准确描述 XML 语言的方式。DTDs 根据适当 XML 语言的语法规则检查 XML 文档的词汇和结构的有效性。

XML DTD 可以指定在文档内部,也可以保存在独立的文档中然后单独链接。

语法
DTD 的基本语法如下所示:

XML/HTML Code复制内容到剪贴板
  1. <!DOCTYPE element DTD identifier   
  2. [   
  3.     declaration1   
  4.     declaration2   
  5.     ........   
  6. ]>  

上述语法中:

DTD 以 <!DOCTYPE 定界符开始。
element 用于告诉解析器从指定的根元素开始解析文档。
DTD identifier 是一个用于文档类型定义的标示符,它可以是一个指向系统中某个文件的路径或者连接到互联网上某个文件的 URL。如果 DTD 指向外部路径,则被称为外部子集。 _ [] 内是一个可选的实体声明列表,被称为内部子集。
内部 DTD
如果一个元素声明在 XML 文档的内部则 DTD 被称为内部 DTD。为了把它作为内部 DTD,XML 声明中的 standalone 属性必须设置为 yes。这意味着,声明的工作独立于外部源。

语法

内部 DTD 语法如下所示:

XML/HTML Code复制内容到剪贴板
  1. <!DOCTYPE root-element [element-declarations]>  

这里 root-element 是根元素的名称,element-declarations 表示我们声明的元素。

示例

下面是一个内部 DTD 的简单示例:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>  
  2. <!DOCTYPE address [   
  3. <!ELEMENT address (name,company,phone)>  
  4.     <!ELEMENT name (#PCDATA)>  
  5.     <!ELEMENT company (#PCDATA)>  
  6.     <!ELEMENT phone (#PCDATA)>  
  7. ]>  
  8. <address>  
  9.     <name>Tanmay Patil</name>  
  10.     <company>TutorialsPoint</company>  
  11.     <phone>(011) 123-4567</phone>  
  12. </address>  

我们来看一下上面的代码:

开始声明 - 使用如下语句开始 XML 声明:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="yes" ?>  

DTD - 紧跟在 XML 头后面,_文档类型声明_如下,通常被称为 DOCTYPE:

<!DOCTYPE address [
DOCTYPE 声明在元素名称的开头包含一个感叹号(!)。DOCTYPE 会通知解析器有一个 DTD 与这个文档相关联。

DTD Body - DOCTYPE 声明后面紧跟 DTD 体,这里我们声明元素,属性,实体和符号:

XML/HTML Code复制内容到剪贴板
  1. <!ELEMENT address (name,company,phone)>  
  2. <!ELEMENT name (#PCDATA)>  
  3. <!ELEMENT company (#PCDATA)>  
  4. <!ELEMENT phone_no (#PCDATA)>  

许多元素都在这里通过 <name> 文档词汇声明。<!ELEMENT name (#PCDATA)> 定义元素_名称_为 "#PCDATA" 类型。这里 #PCDATA 意味着可解析的文本数据。

结束声明 - 最后,DTD 的声明部分使用方括号和尖括号(]>)闭合。这是一个有效的结束定义,后面紧跟的就是 XML 文档内容。

规则

文档类型声明必须出现在文档的开头部分(只先与 XML 头),不允许出现在文档的任意其他位置。
类似于 DOCTYPE 声明,元素声明必须以感叹号开始。
文档类型声明中的 Name 必须与根元素的类型匹配。
外部 DTD
在外部 DTD 中元素声明在 XML 文档的外部。通过指定 system 属性来访问,这个属性值可以是合法的 .dtd 文件或者有效的 URL。为了指示它是外部 DTD,XML 声明的 standalone 属性必须设置为 no。这就意味着,声明包含来自外部源的信息。

语法

下面是外部 DTD 的语法:

<!DOCTYPE root-element SYSTEM "file-name">
这里 file-name 就是 .dtd 扩展的文件。

示例

下面的示例展示了外部 DTD 的用法:

XML/HTML Code复制内容到剪贴板
  1. <?xml version="1.0" encoding="UTF-8" standalone="no" ?>  
  2. <!DOCTYPE address SYSTEM "address.dtd">  
  3. <address>  
  4.     <name>Tanmay Patil</name>  
  5.     <company>TutorialsPoint</company>  
  6.     <phone>(011) 123-4567</phone>  
  7. </address>  
  8. DTD 文件 address.dtd 的内容如下所示:   
  9.   
  10. <!ELEMENT address (name,company,phone)>  
  11. <!ELEMENT name (#PCDATA)>  
  12. <!ELEMENT company (#PCDATA)>  
  13. <!ELEMENT phone (#PCDATA)>  

类型

我们可以通过使用系统标示符或者公共标示符引用一个外部DTD。

系统标示符

系统标示符允许我们指定包含 DTD 声明的外部文件的位置。语法如下:

XML/HTML Code复制内容到剪贴板
  1. <!DOCTYPE name SYSTEM "address.dtd" [...]>  

正如我们可以看到的,它包含 SYSTEM 关键字和一个指向文档位置的 URI 引用。

公共标示符

公共标示符提供了一种定位 DTD 资源的机制,写法如下:

XML/HTML Code复制内容到剪贴板
  1. <!DOCTYPE name PUBLIC "-//Beginning XML//DTD Address Example//EN">  

正如我们可以看到的,它以 PUBLIC 关键字开始,后面紧跟的是专门的标识符。公共标识符被用来标识目录中的条目。公共标识符可以遵循任意格式,但是常用的格式是正式公用标识符(或者 FPIs)。


声明元素
在dtd中声明元素(在一个xml如果一个元素想要让它是合法的,则需要在dtd中声明)
      语法:<!ELEMENT 元素名称 类别>和<!ELEMENT 元素名称 (元素内容)>这两种方式
<!ELEMENT 元素名称 EMPTY>

例如:

XML/HTML Code复制内容到剪贴板
  1. <!ELEMENT br EMPTY>  

则xml可以写成:

XML/HTML Code复制内容到剪贴板
  1. <br/>  

注意点
在dtd中
所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:
元素
属性
实体
PCDATA
CDATA
下面是一些注意点:
(1)实体是用来定义普通文本的变量。实体引用是对实体的引用。
大多数同学都了解这个 HTML 实体引用:"&nbsp;"。这个“无折行空格”实体在 HTML 中被用于在某个文档中插入一个额外的空格。
当文档被 XML 解析器解析时,实体就会被展开。
深入解析XML中的DTD文档类型定义

(2) PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data)。
可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。
PCDATA 是会被解析器解析的文本。这些文本将被解析器解析成实体以及标记。
文本中的标签会被当作标记来处理,而实体会被展开。
不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &amp;、&lt; 以及 &gt; 实体来分别替换它们。
(3)CDATA
CDATA 的意思是字符数据(character data)。
CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。

 
反对 0举报 0 评论 0
 

免责声明:本文仅代表作者个人观点,与乐学笔记(本网)无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
    本网站有部分内容均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,若因作品内容、知识产权、版权和其他问题,请及时提供相关证明等材料并与我们留言联系,本网站将在规定时间内给予删除等相关处理.

  • JavaScript的XMLHttpRequest对象
    ajax的核心技术是XMLHttpRequest对象,简称XHR。//支持IE7及更高的版本function createXML(){if(typeof XMLHttpReqquest!="undefined"){return new XMLHttpRequest();}else if(typeof ActiveXObject!="undefined"){if(typeof arguments.callee.activeXString!
    03-08
  • DOM,html,JavaScript,xml,CSS,浏览器之间的关系
    DOM,html,JavaScript,xml,CSS,浏览器之间
    DOM树解释:W3C所制订的DOM Level分为两大模块:Core和HTML。1.Core核心,W3C规范:满足软件开发者和Web脚本编写者,访问和操控产品项目中包含的可解析的HTML和XML内容。2.HTML模块,规范描述为:HTML之中特定元素的功能,和恰到好处的、易用的、针对常见性任
    03-08
  • 响应消息的内容类型 text/html; charset=utf-8
    问题表述:响应消息的内容类型 text/html; charset=utf-8 与绑定(application/soap+xml; charset=utf-8)的内容类型不匹配。 说明:此类问题当请求内容与响应消息内容不一致时发生。特别地,如果在站点错误描述中出现这个说明,一般代表站点后台自身的网络访
    03-08
  • jquery-easyui:格式化列 js格式化xml
    主框架页面: 在主界面区会加载西区菜单点击的URL内容. !DOCTYPE htmlhtmlheadmeta charset="UTF-8"/title主界面/titlediv th:include="/public/util::public"/div th:include="/public/util::jquery-easyui"/script type="text/javascript" th:src="(${@
    03-08
  • javascript读取XML
    2006-09-22 09:39 作者: 出处: 天极网   我的xml文件Login.xml如下.?xml version="1.0" encoding="utf-8" ?Login    Character        C Text="热血" Value="0"/C        C Text="弱气" Value="1"/C        C Text="
    03-08
  • XML与HTML的区别
    一、HTML       HTML(HyperTextMark-upLanguage)即超文本标记语言,是WWW的描述语言。  二、XML       XML即ExtentsibleMarkup Language(可扩展标记语言),是用来定义其它语言的一种元语言,其前身是SGML(标准通用标记语言)。它没有标签集(tagset),
    03-08
  • 一个xml转html的小程序 别人一个毕业设计【难度
    本来想5分钟写写发过去了。。发现机子上就一个vs2003 没办法用 1.1的来写一个吧。。每次都是从新google下。。这次也不例外。。奶奶的。。发现竟是2.0的代码。。无奈。自己摸索了下。。搞了10分钟写了点代码。。部分源码如下(最下面提供代码下载):---------
    03-08
  • 直接用mysql输出xml或html语句
    mysql -uroot -proot -Hc:/sql.sqlc:/data.html;mysql -uroot -proot -Xc:/sql.sqlc:/data.xml;在sql.sql中写入批处理命令,既可导出xml或html数据
    02-08
  • 微信小程序 - WXML语法与HTML比较
    上章我们看到一个小程序的page是由 .wxml  .wxss  .js  .json组成。wxml:相当于html,开发小程序的页面wxss:相当于css,小程序页面渲染样式js:实现小程序的动态方法等,包括该page的生命周期函数等json:用于小程序的配置如果你已经很熟练掌握Html,那
    02-08
  • 调用Web Service服务出现响应消息的内容类型tex
         错误信息:响应消息的内容类型 text/html; charset=utf-8 与绑定(text/xml; charset=utf-8)的内容类型不匹配。如果使用自定义编码器,请确保正确实现 IsContentTypeSupported 方法。    今天小姚给客户做远程的时候出现这问题,第一感觉应该是配
    02-08
点击排行