`
xbi847ux
  • 浏览: 19175 次
最近访客 更多访客>>
社区版块
存档分类
最新评论

XML入门简介

 
阅读更多

XML入门简介
2011年04月14日
  出处不详,原文作者(可能叫"王铮")
  XML入门简介 什么是XML?
  XML是EXtensible Markup Language的缩写
  XML是一种类似于HTML的标记语言
  XML是用来描述数据的
  XML的标记不是在XML中预定义的,你必须定义自己的标记
  XML使用文档类型定义(DTD)或者模式(Schema)来描述数据
  XML使用DTD或者Schema后就是自描述的语言 XML和HTML的主要区别是什么
  XML是用来存放数据的
  XML不是HTML的替代品,XML和HTML是两种不同用途的语言。
  XML是被设计用来描述数据的,重点是:什么是数据,如何存放数据。
  HTML是被设计用来显示数据的,重点是:显示数据以及如何更好的显示数据。
  HTML是与显示信息相关的, XML则是与描述信息相关的。 XML 什么也不做
  XML 被设计成什么都不做的。
  也许看起来很难理解,但事实上XML确实什么都不做。XML只是用来组织、存储和发送信息的。
  下面的例子是Ordm给Lin的便条,使用的是XML格式: 这个便条有信息头,有信息主体,还包括发送人和接收人。尽管如此,这个XML文档仍然什么都不做,他只是用XML标记存储信息的文件。有人已经编写出来发送和接收并且显示这种格式信息的软件。 XML是自由的、可以扩展的
  XML标记并不是预先规定好的,你必须创造你自己的标记。
  在HTML文档中必须使用规则中定义好的标记。比如:
等等。
  XML允许你定义自己的标记以及文档结构。
  比如在上面例子中的""、""标记都不是在XML规范中事先定义好的。这些标记都是XML文档的作者"创造"出来的。 XML是HTML的补充
  XML并不是HTML的替代品。
  在将来的网页开发中,XML将被用来描述、存储数据,而HTML则是用来格式化和显示数据的。
  对于XML最好的形容可能是: XML是一种跨平台的,与软、硬件无关的,处理信息的工具。 XML在未来Web开发中的应用
  XML无处不在
  XML发展的非常迅速,这实在令人感到惊奇,有很多的软件开发商都采用了XML标准。
  我们相信,在未来的Web开发中,XML将和HTML一样受到重视,他们都是Web技术的基础。XML将成为最普遍的数据操纵和数据传输的工具。 如何使用XML? 首先要明确的是:XML是被设计用来存储数据、携带数据和交换数据的,他不是为了显示数据而设计的。 XML可以从HTML中分离数据
  通过XML,你可以在HTML文件之外存储数据。
  在不使用XML时,HTML用于显示数据,数据必须存储在HTML文件之内;使用了XML,数据就可以存放在分离的XML文档中。这种方法可以让你集中精力去到使用HTML做好数据的显示和布局上,并确保数据改动时不会导致HTML文件也需要改动。这样可以方便维护页面。
  XML数据同样可以以"数据岛"的形式存储在HTML页面中。你仍然可以集中精力到使用HTML格式化和显示数据上去。 XML用于交换数据
  通过XML,我们可以在不兼容的系统之间交换数据。
  在现实生活中,计算机系统和数据库系统所存储的数据有N^N种形式,对于开发者来说,最耗时间的就是在遍布网络的系统之间交换数据。把数据转换为XML格式存储将大大减少交换数据时的复杂性,并且还可以使得这些数据能被不同的程序读取。 XML 和 B2B 使用XML, 可以在网络中交换金融信息。
  在不远的将来,我们可以期望看到很多关于XML和B2B(Business To Business)的应用。
  XML正在成为遍布网络的商业系统之间交换金融信息所使用的主要语言。许多与B2B有关的完全基于XML的应用程序正在开发中。 XML可以用于共享数据
  通过XML,纯文本文件可以用来共享数据。
  既然XML数据是以纯文本格式存储的,那么XML提供了一种与软件和硬件无关的共享数据方法。
  这样创建一个能够被不同的应用程序读取的数据文件就变得简单了。同样,我们升级操作系统、升级服务器、升级应用程序、更新浏览器就容易多了。 XML可以用于存储数据
  利用XML, 纯文本文件可以用来存储数据。大量的数据可以存储到XML文件中或者数据库中。应用程序可以读写和存储数据,一般的程序可以显示数据。 XML可以充分利用数据
  使用XML,你的数据可以被更多的用户使用。既然XML是与软件、硬件和应用程序无关的,所以可以使你的数据可以被更多的用户、更多的设备所利用,而不仅仅是基于HTML标准的浏览器。别的客户端和应用程序可以把你的XML文档作为数据源来处理,就像他们对待数据库一样,你的数据可以被各种各样的"阅读器"处理,这时对某些人来说是很方便的,比如盲人或者残疾人。 XML可以用于创建新的语言
  XML是WAP和WML语言的母亲。
  无线标记语言(WML,The Wireless Markup Language ), 用于标识运行于手持设备上(比如:手机)的Internet程序。
  WML采用了XML的标准。你可以在WML 指南中详细的了解。 展望未来
  如果开发者有足够的预见性,那么将来的应用程序都应该使用XML的形式来存储数据。将来我们所使用的字处理器、电子表格软件和数据库应该能够以纯文本的格式相互读取数据,而不需要经过格式转化的过程。我们只能期盼微软和其他软件开发商也赞同这一点。//事实上微软正在大力发展XML的应用呢。 XML 语法 一个XML文档的例子
  XML文档使用了自描述的和简单的语法。 文档的第1行:XML声明--定义此文档所遵循的XML标准的版本,在这个例子里是1.0版本的标准,使用的是ISO-8859-1 (Latin-1/West European)字符集。
  文档的第2行是根元素(就象是说"这篇文档是一个便条"): 文档的第3--6行描述了根元素的四个子节点(to, from, heading,和 body): 文档的最后一行是根元素的结束: 你能从这个文档中看出这是Ordm给Lin留的便条么?难道能不承认XML是一种美丽的自描述语言么? 所有的XML文档必须有一个结束标记
  在XML文档中, 忽略结束标记是不符合规定的。
  在HTML文档中,一些元素可以是没有结束标记的。下面的代码在HTML中是完全合法的: 但是在XML文档中必须要有结束标记,象下面的例子一样: 注意: 你可能已经注意到了,上面例子中的第一行并没有结束标记。这不是一个错误。因为XML声明并不是XML文档的一部分,他不是XML元素,也就不应该有结束标记。 XML标记都是大小写敏感的
  这与HTML不一样, XML标记是大小写敏感的。
  在XML中, 标记与标记是两个不同的标记。
  因此在XML文档中开始标记和结束标记的大小写必须保持一致。 所有的XML元素必须合理包含
  在XML中不允许不正确的嵌套包含。
  在HTML中,允许有一些不正确的包含,例如下面的代码可以被浏览器解析: 在XML中所有元素必须正确的嵌套包含,上面的代码应该这样写: 所有的XML文档必须有一个根元素
  XML文档中的第一个元素就是根元素。
  所有XML文档都必须包含一个单独的标记来定义,所有其他元素的都必须成对的在根元素中嵌套。XML文档有且只能有一个根元素。
  所有的元素都可以有子元素,子元素必须正确的嵌套在父元素中,下面的代码可以形象的说明: 属性值必须使用引号""
  在XML中,元素的属性值没有引号引着是不符合规定的。
  如同HTML一样,XML元素同样也可以拥有属性。XML元素的属性以名字/值成对的出现。XML语法规范要求XML元素属性值必须用引号引着。请看下面的两个例子,第一个是错误的,第二个是正确的。 第一个文档的错误之处是属性值没有用引号引着。 正确的写法是: date="12/11/99". 不正确的写法: date=12/11/99. 使用XML,空白将被保留
  在XML文档中,空白部分不会被解析器自动删除。
  这一点与HTML是不同的。在HTML中,这样的一句话:
  "Hello              my name is Ordm"将会被显示成:"Hello my name is Ordm",
  因为HTML解析器会自动把句子中的空白部分去掉。 使用XML, CR / LF 被转换为 LF
  使用 XML, 新行总是被标识为 LF(Line Feed,换行)。
  在Windows应用程序中,文本中的新行通常标识为 CR LF (carriage return, line feed,回车,换行)。在Unix应用程序中,新行通常标识为 LF。还有一些应用程序只使用CR来表示一个新行。 XML中的注释
  在XML中注释的语法基本上和HTML中的一样。
    XML并没有什么特别的
  XML确实没有什么特别的地方。他只是一些用尖括号扩在一起的普通的纯文本。
  编辑普通文本的软件也可以编辑XML文档。
  然而在一个支持XML的应用程序中,XML标记往往对应着特殊的操作,有些标记可能是可见的,而有些标记则可能不会显示出来,而不会有什么特殊的操作。 XML元素 XML元素是可以扩展的,它们之间有关联。
  XML元素有简单的命名规则。 XML元素是可以扩展的
  XML文档可以被扩展一边携带更多的信息。
  请看下面的XML便条例子: 让我们来设想一个能够读取此XML文档的并能解读其中XML元素(, , 和)的软件,可能的输出如下: 我们再来设想,如果便条的作者Ordm在这个XML文档中加入一些额外的信息,如下所示: 那么原来的应用程序会中断或者崩溃么?
  不会。应用程序仍然会正确的解读, , 和 等元素,并且产生同样的输出。
  XML文档是可以扩展的! XML元素是相互关联的
  XML元素之间是父元素和子元素的关系。
  为了更好的理解XML术语,必须了解XML元素之间的关系如何,以及元素的内容是如何被描述的。
  设想有这样一本书: 署名: XML 指南
  第一章: XML入门简介
  什么是HTML 
  什么是XML 
  第二章: XML语法
  XML元素必须有结束标记
  XML元素必须正确的嵌套 我们可以用XML文档来描述这本书:  XML 指南  XML入门简介
  什么是HTML
  什么是XML
  
  XML语法
  XML元素必须有结束标记
  XML元素必须正确的嵌套
  
   在上面的代码中,Book元素是XML文档的根元素,title元素和chapter元素是book元素的子元素。Book元素是title元素和chapter元素的父元素。title元素,prod元素和chapter元素是平级元素,因为他们都有同一个父元素。 XML元素的内容
  XML元素有不同的内容。
  XML元素指的是从该元素的开始标记到结束标记之间的这部分内容。
  XML元素有元素内容,混合内容,简单内容或者空内容。每个元素都可以拥有自己的属性。
  在上面的例子中,book元素有元素内容,因为book元素包含了其它的元素。Chapter元素有混合内容,因为它里面包含了文本和其他元素。para元素有简单的内容,因为它里面仅有简单的文本。prod元素有空内容,因为他不携带任何信息。
  在上面的例子中,只有prod元素有属性,id属性值是33-657,media属性值是paper。 XML元素命名
  XML元素命名必须遵守下面的规则:
  元素的名字可以包含子母,数字和其他字符。
  元素的名字不能以数字或者标点符号开头。
  元素的名字不能以XML(或者xml,Xml,xMl...)开头。
  元素的名字不能包含空格。
  自己"发明"的XML元素还必须注意下面一些简单的规则:
  任何的名字都可以使用,没有保留字(除了XML),但是应该使元素的名字具有可读性,名字使用下划线是一个不错的选择。
  例如: , .
  尽量避免使用"-",".",因为有可能引起混乱。
  只要你愿意元素的名字可以很长,但也不要太夸张了哦。命名应该遵循简单易读的原则,例如:是一个不错的名字,而则显得罗嗦了。 
  XML文档往往都对应着数据表,我们应该尽量让数据库中的字段的命名和相应的XML文档中的命名保持一致,这样可以方便数据变换。
  非英文/字符/字符串也可以作为XML元素的名字,例如这都是完全合法的名字。但是有一些软件不能很好的支持这种命名,所以尽量使用英文字母来命名。
  在XML元素命名中不要使用":",因为XML命名空间需要用到这个十分特殊的字符。 XML 属性 跟HTML一样,XML元素再开始标记处可以有元素属性。
  属性通常包含一些关于元素的额外信息。 XML属性 XML元素可以拥有属性。
  你一定还记得这样的HTML代码吧: 。src是img元素的属性,提供了关于img元素的额外信息。
  在HTML中 (在XML中也一样)元素的属性提供了元素的额外信息。 书信提供的信息通常不是数据的一部分。在下面的例子中,类型和数据毫不相关,但对于操作这个元素的软件来说却相当重要。 引用风格"female" 还是 'female'?
  属性值必须用引号引着。单引号、双引号都可以使用。例如一个人的性别,person元素可以这样写: 也可以这样写:  上面的两种写法在一般情况下是没有区别的,使用双引号的应用更普遍一些。但是在某些特殊的情况下就必须使用单引号,比如下面的例子: 使用子元素还是使用属性
  数据既可以存储在子元素中也可以存储在属性中。
  请看下面的例子: 在第一个例子中,sex是一个属性,在第二个例子中,sex则是一个子元素。这两个例子都提供了相同的信息。
  什么时候用属性,什么时候用子元素没有一个现成的规则可以遵循。我的经验是属性在HTML中可能相当便利,但在XML中,你最好避免使用。 我喜欢的风格
  我更愿意把数据存储到子元素中。
  下面的三个XML文档包含了相同的信息:
  第一个例子使用了data属性: 第二个例子使用了data元素: 第三个例子使用了扩展的data元素: (这就是我推荐的样式): 避免使用属性?
  应该避免使用属性么?
  这里有一些使用属性引发的问题:
  属性不能包含多个值(子元素可以)。
  属性不容易扩展。
  属性不能够描述结构(子元素可以)。
  属性很难被程序代码处理。
  属性值很难通过DTD进行测试。
  如果使用属性来存储数据,那么所编写的XML文档一定很难阅读和操作。尽量使用元素来描述数据,仅使用属性来描述那些与数据关系不大的额外信息。
  不要象下面的例子那样(如果你那么做了说明你还没有明白上面的观点)。 属性规则的例外
  规则总是有例外的。
  我的关于属性的规则也有一个例外:
  有些时候应该为一个元素设计一个ID引用,通过这个ID可以引用存取特定的XML元素,就象HTML中的name和id属性一样。请看下面的例子: 在上面的例子中,ID属性就相当于一个计数器,或者是一个唯一的标识符,在XML文档中标识不同的便条信息,他不是便条信息的一部分。
  我们所要尽力向读者说明的是:元数据(与数据有关的数据)应该以属性的方式存储,而数据本身应该以元素的形式存储。 XML 确认 符合语法的XML文档称为结构良好的XML文档。
  通过DTD验证的XML文档称为有效的XML文档。 "结构良好的" XML文档
  一个结构良好的XML文档应该使用正确的语法。
  一个结构良好的XML文档应该遵守XML语法规则,前面一章给出的例子就是一个结构良好的XML文档: "有效的" XML文档
  一个有效的XML文档应该遵守DTD的描述。
  一个有效的XML文档也是一个结构良好的XML文档,同时还必须符合DTD的规则。 XML DTD  DTD定义了XML文档中可用的合法元素。
  DTD的意图在于定义XML文档的合法建筑模块。他通过定义一系列合法的元素决定了XML文档的内部结构。结构良好的XML文档不一定是有效的XML文档,但有效的XML文档一定是结构良好的XML文档。如果你想了解更多关于DTD的知识可以参考DTD 指南。 XML Schema   XML Schema(XML模式)是基于XML的DTD的替代品。
  W3C使得DTD和Schema可以相互替代,读者可以在Schema 指南中了解到更多信息。 错误 XML文档中发生的错误将导致XML程序停止。
  W3C的XML规范声明:如果程序在处理XML文档中发现一个有效的错误,那么此程序应该终止。这就是XML软件相对于容易编写的原因。所有的XML文档地都应该是协调一致的。
  在HTML中,HTML文件可能包含很多错误,(比如一个元素有开始标记没有结束标记)这也是HTML浏览器体积之所以很大的一个原因,当他们发现错误的时候,他们有各自不同的方法来决定此HTML文件应该如何显示。
  在XML中决不会发生这种情况。 XML 浏览器(Netscape、Explorer) 在我们这个XML指南里,我们把焦点放在Internet Explorer 5.0及其以后的版本上。 Web站点上的XML
  许多应用程序都支持XML。我们主要研究Internet Explorer 5.X+
  对此有些人可能会抱怨,但是我们只想把事情简单化,在网络环境中这是我们所知道的唯一一个真实测试XML例子的方法。 XML Netscape 6 Netscape 6 支持 XML。 在Netscape 6中察看XML源文件可以在页面上点鼠标右键,然后选择"察看源文件"。 XML Internet Explorer 5.0 IE 5.0 支持 XML 1.0 标准。
  Internet Explorer 5.0 支持XML1.0标准和XML DOM(Document Object Model)的国际标准。这些标准都是W3C发布的(World Wide Web Consortium)。
  Internet Explorer 5.0 支持下列 XML 特性:
  察看XML文档
  对W3C DTD标准的完全支持
  在HTML页面中以数据岛形式嵌入XML 
  把XML数据绑定到HTML元素上
  使用XSL程序转换和显示XML文档
  使用CSS显示XML文档
  支持 XML DOM 
  Internet Explorer 5.0 也支持XML行为(XML Behaviors):
  行为是Microsoft独有的技术
  行为可以从HTML页面中分离程序脚本
  行为可以将数据存储到客户端的硬盘上
  在下一章中将给出一些相关的例子。
  如果你想了解更多关于Internet Explorer的信息你可以到W3Schools' Browser Information浏览最新的信息。 察看 XML 文件 原始的XML文件可以用IE 5.0 (或者更高的版本)或者Netscape 6来察看,但是如果希望让XML文档象Web页那样显示就必须添加一些额外的显示信息。 察看XML文件
  我们可以使用IE5.0 (或者更高的版本)来浏览XML文档。你可以单击一个超链接或者是在浏览器的地址栏中输入URL地址,或者是在文件夹中双击XML文档。如果你用 IE打开XML文档后发现浏览器用带颜色的标识XML文档的根元素和子元素,XML元素的左边有一个"+"号,那么你可以单击这个"+"号,展开这个元素的下一级结构;如果元素的左边有一个"-"号,那么你也可以单击这个"-"号,收拢这个元素的下一级结构,如果你愿意察看XML文档的源文件,那么你可以在右键菜单中选择"察看源文件"。
  我们也可以用Netscape 6来打开XML文档,并且也可以用右键选择"察看源文件" 当你用Netscape 6打开XML文档后,浏览器将用带颜色的代码显示根元素和子元素。
  我们来看一个XML文件: note.xml
  注意:不要指望XML文档可以象HTML文件那样格式化。 浏览不合格的XML文档
  如果用IE浏览器打开一个不正确的XML文档,浏览器将会报告错误。
  来看下面这个例子: note_error.xml 其它的例子
  浏览一些XML文档可以帮助你找到学习XML的感觉。
  我们为你收集了一些XML资料:
  An XML CD catalog
  这是我的父辈的CD收藏纪录,存储成XML数据格式。
  An XML plant catalog
  这是一个植物商店的植物产品目录,也存储成XML格式了。
  A Simple Food Menu
  这是一个餐馆的早餐食谱目录,同样也是XML格式的。 为什么XML在浏览器中的显示是这个样子呢?
  单纯的XML文档并不包含如何显示数据的信息。
  既然XML标记是由XML文档作者"创造"和"发明"的,那么我们不可能知道一个标记是指HTML中的表格还是一个木桌子。
  在没有任何额外的信息指示如何显示数据的情况下,IE浏览器一般以树状视图的形式显示XML数据。
  在下面的几个小节中,我们将描述一些解决XML文档显示问题的方案,包括CSS, XSL, JavaScript,和XML数据岛。 使用CSS来显示XML 使用CSS样式单 (Cascading Style Sheets) ,可以给XML文档添加额外的显示信息。 使用CSS来显示未来的XML文档么?
  应该使用CSS来显示你未来的XML文档么?
  不,我们不推荐这样做!但是我们还是应该实验一下:
  我们先来看一个单纯的XML文档: The CD Catalog
  然后我们来看CSS样式表单文件: The CSS file
  最后,我们来看用CSS显示出来的XML文档: The CD Catalog formatted with the CSS file
  这是用CSS样式单修饰的XML文档的一小部分代码片断:     Empire Burlesque Bob Dylan USA Columbia 10.90 1985   Hide your heart Bonnie Tyler UK CBS Records 9.90 1988  . . . .     即使使用CSS的显示效果很好,我们不认为使用CSS样式单显示XML文档是未来Web开发的趋势。我们相信,使用XSL程序格式化XML文档将会是未来的趋势,目前最主要的浏览器都支持这种技术。 使用XML创建未来的主页?
  你愿意使用XML来创建你未来的网站么?
  不,我不认为这是一个好主意。我们也不拒绝去做这样一个尝试:A homepage written in XML.
  我们不相信XML会直接用于创建未来的Web页面。
  我们仍然相信,XHTML - 利用XML重新定义过的HTML可能是一个更好的选择: 请阅读我们的XHTML 指南。 使用XSL来显示XML数据 使用XSL可以给XML文档添加上显示信息。 使用XSL来显示XML文档
  XSL是XML的可扩展样式单语言。
  XSL (全称是:可扩展的样式单语言,the eXtensible Stylesheet Language)比CSS样式单功能要强大的多。XSL的一个主要的用途就是将XML文档转换成HTML格式的文件,然后再交付给浏览器,由浏览器显示转换的结果:
  如果你有网景6或者IE 5(或者更高的版本),你可以观看the XML file and the XSL style sheet.
  在IE6中的显示结果:View the result in IE 6
  在IE5中的显示结果:View the result in IE 5
  注意下面的代码片断中的第二行: 如果你想了解更多关于XSL的知识,请阅读我们的XSL 指南。 XML数据岛 使用IE5.0或者更高的版本,XML数据可以以数据岛的形式嵌入HTML页面。 在HTML页面中嵌入XML数据
  使用非官方标准的标记可以将XML数据嵌入到HTML页面中。
  XML数据可以象下面的例子那样嵌入HTML页面: 或者象下面这样嵌入外部单独的XML文件: 注意那个标记是一个HTML元素,而不是一个XML元素。 数据绑定
  XML数据岛可以绑定到HTML元素上(比如表格)。
  在下面的例子中,一个XML数据岛(ID=cdcat)被从外部XML文档载入。一个HTML的表格绑定到此数据岛上。HTML表格内部的span元素使用datafld属性和XML文档相应的XML元素相互绑定。 如果你使用的是IE 5.0 或者更高版本, 你可以自己尝试一下try it yourself.
  如果你使用的是IE 5.0 或者更高版本,你可以观看external XML file.
  同样也可以实验this example, 论证元素, , and . 微软的XML解析器 XML解析器可以读取、更新、创建、操作一个XML文档。 使用XML解析器
  微软的XML解析器是和IE5.0+浏览器捆绑在一起的。
  一旦你安装了IE5.0,那么就获得了XML解析器。这个解析器除了被浏览器内部调用外,还可以在脚本中或者程序中调用。这个解析器的特点是支持与程序设计语言无关的编程模型,他支持以下技术:
  JavaScript, VBScript, Perl, VB, Java, C++ 等等
  W3C XML 1.0 和 XML DOM 
  DTD 和 XML文档验证
  如果浏览器使用JavaScript作为脚本语言,那么利用下面的代码可以创建XML文档对象: 如果浏览器使用VBScript作为脚本语言,那么利用下面的代码可以创建XML文档对象: 如果在ASP程序中使用VBScript脚本语言,那么就可以使用下面的代码形式: 将XML文档载入解析器
  使用脚本代码可以将XML文档载入解析器。
  下面的代码可以将一个XML文档载入解析器: 第二行代码创建Microsoft XML解析器的实例。
  第三行代码关闭异步载入,确保XML解析器在把XML文档完全载入以前不会对XML文档进行解析。
  第四行则告诉解析器需要载入的XML文档名字是note.xml。 把纯XML文档由字符载入解析器
  解析器可以从一个文本字符串中载入XML文本。
  下面的代码演示了将文本字符串载入解析器: 注意这里载入字符串使用的是"loadXML()"方法)(而不是前面用过的"load()"方法), "loadXML()"是用于载入字符串,"load()"是用于载入XML文档。 使用JavaScript语言显示XML数据
  可以使用JavaScript语言来显示XML数据。
  JavaScript (或者 VBScript)可以从XML文档中导入数据,并将这些数据在HTML页面中显示出来。
  下面我们来看一下XML和HTML是如何进行相互之间的互补的,首先来看一个XML文档 ( note.xml), 然后我们看一个包含了导入XML文档并显示在HTML页面中的JavaScript脚本代码的HTML文档( note.htm) 。
  去看看他是如何工作的, 自己尝试一下吧  
  你可以在我们的DOM School中了解更多的关于JavaScript的知识。 现实生活中的XML XML最现实的一个例子就是装载信息。 实例: XML 新闻
  XML新闻是一种交换新闻和其他信息的规范。
  使用这样一种规范,使新闻工作制作者和新闻消费者跨越不同的硬件、软件、编程语言来生产、接收、存档各种各样的新闻信息变得更简单快捷。 一个XML新闻文档的例子:    Colombia Earthquake     143 Dead in Colombia Earthquake   By Jared Kotler, Associated Press Writer   Bogota, Colombia Monday January 25 1999 7:28 ET     关于XML新闻更多的信息可以去访问网址: http://www.xmlnews.org/ XML 命名空间 XML 命名空间提供了一种避免元素命名冲突的方法。 命名冲突
  因为XML文档中使用的元素不是固定的,那么两个不同的XML文档使用同一个名字来描述不同类型的元素的情况就可能发生。而这种情况又往往会导致命名冲突。请看下面两个例子
  这个 XML 文档在table元素中携带了水果的信息: 这个 XML 文档在table元素中携带了桌子的信息(家具,不能吃的哦): 如果上面两个XML文档片断碰巧在一起使用的话,那么将会出现命名冲突的情况。因为这两个片断都包含了元素,而这两个table元素的定义与所包含的内容又各不相同。 使用前缀解决命名冲突问题
  下面的XML文档在table元素中携带了信息: 下面的XML文档携带了家具table的信息: 现在已经没有元素命名冲突的问题了,因为这两个文档对各自的table元素使用了不同的前缀,table元素在两个文档中分别是( 和)。
  通过使用前缀,我们创建了两个不同的table元素。 使用命名空间
  下面的XML文档在table元素中携带了信息: 下面的XML文档携带了家具table的信息: 在上面两个例子中除了使用前缀外,两个table元素都使用了xmlns属性,使元素和不同的命名空间关联到一起。 命名空间属性
  命名空间属性一般放置在元素的开始标记处,其使用语法如下所示: 在上面的例子中,命名空间定义了一个Internet 地址: W3C 命名规范声明命名空间本身就是一个统一资源标示符,Uniform Resource Identifier (URI)。
  当我们在元素的开始标记处使用命名空间时,该元素所有的子元素都将通过一个前缀与同一个命名空间相互关联。
  注意:用来标识命名空间的网络地址并不被XML解析器调用,XML解析器不需要从这个网络地址中查找信息,该网络地址的作用仅仅是给命名空间一个唯一的名字,因此这个网络地址也可以是虚拟的,然而有很多公司经常把这个网络地址值象一个真实的Web页面,这个地址包含了关于当前命名空间更详细的信息。
  可以访问http://www.w3.org/TR/html4/. 统一资源标识符
  通用资源标识符(A Uniform Resource Identifier (URI))是一个标识网络资源的字符串。最普通的URI应该是统一资源定位符Uniform Resource Locator (URL)。URL用于标识网络主机的地址。另一方面,另一个不常用的URI是通用资源名字Universal Resource Name (URN)。在我们的例子中,一般使用的是URLs。
  既然前面的例子使用的URL地址来标识命名空间,我们可以确信这个命名空间是唯一的。 默认的命名空间
  定义一个默认的XML命名空间使得我们在子元素的开始标记中不需要使用前缀。他的语法如下所示: 下面的XML文档在table元素中包含了水果的信息: 下面的XML文档包含了家具table的信息: 使用命名空间
  当开始使用XSL的时候,就会发现命名空间使用的是如此频繁。XSL样式单主要用于将XML文档转换成类似于HTML文件的格式。
  如果看一下下面的XSL文档,就会发现有很多标记都是HTML标记。那些标记并不是HTML标记,是加了前缀的XSL,这个XSL前缀由命名空间" http://www.w3.org/TR/xsl"所标识:         Title Artist             XML CDATA 在XML文档中的所有文本都会被解析器解析。
  只有在CDATA部件之内的文本会被解析器忽略。 解析数据
  XML 解析器通常情况下会处理XML文档中的所有文本。
  当XML元素被解析的时候,XML元素内部的文本也会被解析: XML解析器这样做的原因是XML元素内部可能还包含了别的元素,象下面的例子,name元素内部包含了first和last两个元素: 解析器会认为上面的代码是这样的: 转义字符
  不合法的XML字符必须被替换为相应的实体。
  如果在XML文档中使用类似""标记结束: 在前面的例子中,所有在CDATA部件之间的文本都会被解析器忽略。
  CDATA注意事项:
  CDATA部件之间不能再包含CDATA部件(不能嵌套)。如果CDATA部件包含了字符"]]>" 或者""之间没有空格或者换行符。 XML编码 XML文档可以包含外文字符比如挪威语或者法语(中文当然也可以!这一部分还是不能照原文翻译,下面有些内容是我自己写的)
  为了让你的解析器能够明白这些字符,你必须在XML文档中统一的字符编码标准。 Windows 95/98 记事本
  Windows 95/98 记事本不能以Unicode的编码格式保存文件。
  可以使用记事本来编辑和保存包含了外文字符的XML文档 (比如:挪威语或者法语或者中文) 但是如果你用浏览器打开这个用记事本编辑过的XML文档,将会出现一个错误open it with IE 5.0。 在Windows 95/98 记事本中使用编码
  Windows 95/98 记事本编辑XML文件必须进行编码属性设置。
  为了避免发生错误,可以在XML文档声明中加上一个encoding属性,指明此XML文档的编码类型,但是不要使用Unicode编码。
  下面的编码类型不会导致错误,( 用IE 5.0+浏览器观看), 并且汉字显示正常: 下面的编码类型不会导致错误,( 用IE 5.0+浏览器观看), 并且汉字显示正常: 下面的编码类型不会导致错误,( 用IE 5.0+浏览器观看), 并且汉字显示不正常(乱码): 下面的编码类型不会导致错误,( 用IE 5.0+浏览器观看), 并且汉字显示不正常(乱码): 下面的编码类型不会导致错误,( 用IE 5.0+浏览器观看),并且汉字显示正常: 下面的编码类型会导致错误,( 用IE 5.0+浏览器观看): 使用Windows 2000 记事本
  Windows 2000 记事本可以以Unicode编码格式保存文件。
  Windows 2000 的记事本支持Unicode字符集。如果使用Win2000的记事本以Unicode的编码格式保存XML文档(请注意这里在XML声明中没有编码信息): 下面这个文件; note_encode_none_u.xml, 在IE5.0+中将不会出现错误,但如果你使用网景Netscape 6.2,就可能出错。读者比较note_encode_none.xml和note_encode_none_u.xml这两个文件,如果单独看他们各自的源文件,是没有区别的,但为什么一个能显示,一个不能显示呢?答案就是Unicode字符集。 Windows 2000 记事本编码
  Windows 2000记事本还可以以"UTF-16"编码格式保存文件。
  如果你在XML文档中声明了编码属性而又以Unicode编码格式保存文件,将可能发生错误。
  下面的代码将会导致错误 ( 用浏览器察看): 下面的代码将会导致错误 ( 用浏览器察看): 下面的代码将会导致错误 ( 用浏览器察看): 下面这个文件; note_encode_utf16_u.xml, 将会在IE5.0+中显示正常,在网景Netscape 6.2浏览器中将会出现错误。 错误信息
  当使用IE5.0或者更高版本浏览XML文档时,可能会遇到两中不同的编码错误:
  在文本内容中发现一个非法字符(An invalid character was found in text content)。
  如果你的XML文档和你的XML文档的编码格式不匹配就可能导致错误发生。通常情况是,XML文档包含一些"非英文"字符,并且使用了单字节编码的编辑器,而且没有在XML文档的声明中设置XML文档的编码格式。 
  不支持从当前的编码格式转换成另一种编码格式(Switch from current encoding to specified encoding not supported)。
  如果XML文档以Unicode/UTF-16编码格式保存,但是XML文档的声明中却设置了编码格式是一些单字节的编码(比如 Windows-1252, ISO-8859-1 或者  UTF-8);或者XML文档以单字节编码格式保存,但是XML文档的声明中却设置了编码格式是一些Unicode/UTF-16的编码形式,这样两种情况都会导致错误发生。 结论 结论:在保存XML文档之前在XML文档的声明中设置文档的编码格式,我的一些关于避免错误发生的建议:
  使用一种支持Unicode编码格式的编辑器。
  确信你知道自己正在使用那种编码格式。
  在XML文档中使用属性声明设置编码格式。 XML 技术概要 在这一节里,将要列出一些很重要的XML相关技术。这对理解和开发XML应用程序是很有帮助的。 XHTML - 可扩展HTML(Extensible HTML)
  XHTML 使用XML重新定义了HTML 4.01的语法。XHTML 1.0是HTML的下一个版本。更多的请参考我们的XHTML 指南。
  CSS - 层叠样式表单(Cascading Style Sheets)
  CSS 样式单可以为XML文档添加显示信息。更多信息请阅读我们的CSS 指南。
  XSL - 可扩展样式单语言(Extensible Style Sheet Language)
  XSL由三部分组成: XML文档转换(XML Document Transformation ,又叫XSLT),模式匹配语法( a pattern matching syntax ,又叫XPath), 格式化对象( a formatting object interpretation,XSL FO)。
  XSLT - XML 转换语言(XML Transformation)
  XSLT 是一种比CSS强大很多的语言。它可以将XML文档转换成其他格式的文档。更多知识请阅读 XSL 指南。
  XPath - XML匹配模式(XML Pattern Matching)
  XPath是一种用于标识XML文档各个部分的语言。这是一种为了XSLT 和 XPointer而设计出来的语言。
  XLink - XML链接语言(XML Linking Language)
  链接语言(The XML Linking Language ,XLink), 允许在不同的XML资源之间建立链接关系。
  XPointer - XML指针语言(XML Pointer Language)
  XML指针语言(The XML Pointer Language ,XPointer), 标识XML文档的内部结构,例如元素、属性、内容等。
  DTD - 文档类型定义 (Document Type Definition)
  DTD主要用于定义编写XML文档所使用的元素。更多知识请参考 DTD 指南。
  Namespaces - 命名空间
  XML命名空间提供了一种可以把元素、属性、名字和URL地址引用相互关联的方法。
  XSD - XML模式(XML Schema)
  模式可以和DTD相互替代,并且功能更强大。模式使用XML格式编写,支持命名空间和数据类型。更多请参考 Schema 指南。
  XDR - 数据简化(XML Data Reduced)
  XDR是XML模式(XML Schema)的简化版本。IE5.0+浏览器支持XDR。
  DOM - 文档对象模型(Document Object Model)
  DOM定义了XML文档的接口、属性和方法。更多请参考 DOM 指南。
  XQL   XML查询语言(XML Query Language)
  XQL为存放XML文档中的数据提供一种便捷的查询语言。
  SAX - XML的简单API(Simple API for XML)
  SAX 是另一种读取和操作XML文档的编程接口。(与DOM类似) W3C 介绍 互联网组织(The World Wide Web Consortium ,W3C)成立于1994年。主要通过发展各种WWW协议来领导Web。比如HTML, CSS 和 XML都是由W3C制定的。
  W3C最重要的工作就是制定网络规范,或者描述一些构造Web的技术。
  如果想了解更全面的XML标准请访问 W3C School。 XML规范 ++主题:〖 XML规范和学习资源小结〗 XML Namespace规范
  http://www.w3.org/TR/1999/REC-xml-names-19990114/ ------------------------------------------  →XML网站 -----------------------------------
  http://xml.apache.org/
  是Apache XML Project的官方站点. 
  http://xml.apache.org/cocoon
  http://xml.apache.org/cocoon2
  是Cocoon和XSP技术的大本营.推荐! 
  http://xml.apache.org/fop/
  介绍Apache FOP. 
  http://www.w3schools.com/
  许多教程,XML,XSL,WML,DTD,Schema,CSS,Javascript等等. 
  http://zvon.org/
  XML技术教程和技术参考,非常全面. 
  http://www.xml.com/
  适合具有一定XML技术基础的读者. 
  http://www.xml.com.cn/
  中国XML论坛,内容,技术,可读性一流. 
  http://www.xml.org.cn/
  中国XML联盟. 
  -----------------------------
  软件下载
  Cocoon可以到http://xml.apache.org/站点去下载.
  Tomcat可以到http://jakaarta.apache.org/站点去下载.
  J2SE SDK可以到http://java.sun.com/站点去下载.
  XMLSpy4.0可以到http://www.smlspy.com站点去下载.
  Nokia WAP Toolkit可以到http://www.nokia.com站点去下载. 
分享到:
评论

相关推荐

    XML入门简介,简单介绍XML

    XML入门简介,XML是EXtensible Markup Language的缩写 XML是一种类似于HTML的标记语言 XML是用来描述数据的 XML的标记不是在XML中预定义的,你必须定义自己的标记 XML使用文档类型定义(DTD)或者模式(Schema)...

    xml入门经典(第5版)

    资源名称:XML入门经典(第5版)内容简介:《XML入门经典(第5版)》的主要内容如下:介绍XML的目标以及构建它的规则;探索不同的技术以协助完成对XML的正确格式的验证;展示如何使用XQuery创建新的XML文档并查询已有...

    XML入门XML入门

    XMLXML入门XML入门XML入门XML入门XML入门XML入门XML入门XML入门XML入门XML入门

    XML入门经典(第4版 中文版) part2

    [大家网]XML入门经典(第4版)[www.TopSage.com].part2,希望对你有帮助

    [XML入门经典(第4版)].(Beginning.XML.4th.Edition).(美)亨特,(美)拉夫特,(美)福思特.扫描版.pdf

    中文名: XML入门经典(第四版) 原名: Beginning XML 4th Edition 作者: (美)亨特 (美)拉夫特 (美)福思特 译者: 吴文国 资源格式: PDF 版本: 扫描版 出版社: (美)亨特 (美)拉夫特 (美)福思特 书号: 9787302194651 发行...

    TinyXML入门教程

    这个是一个学习xml的很好的学习资料 大家可以下载看看

    XML入门经典(第4版).part1.rar

    《XML入门经典(第4版)》读者对象:《XML入门经典(第4版)》适用任何对XML用法感兴趣的程序员使用,当然也适合广大的XML初学人员入门。如果具有一定的Web编程或数据转换经验,阅读起来将更为容易。 编辑推荐 《XML入门...

    xml入门教程/xml入门教程

    &1.XML简介 XML的背景 1) XML代表可扩展的标记语言(eXtensible Markup Language); 2) XML由W3C联盟发展维护; 3) XML是一种元语言,可以用来定义其它标签语言; 4) XML没有定义任何标记,它提供了一种工具定义...

    XML入门教程.pdf XML入门教程.pdf

    XML入门教程.pdf XML入门教程.pdf XML入门教程.pdf

    TinyXML入门教程_TinyXML入门教程_

    tinyXML文件格式的详细说明,初学参考。

    C#XML入门经典C#编程人员必备的XML技能

    C#XML入门经典C#编程人员必备的XML技能

    xml入门,基础.ppt

    XML入门、简介 通过阅读此文档,对xml有一个初步认识,了解XML的作用 掌握XML的结构

    C# XML入门经典 —— C#编程人员必备的XML技能

    C# XML入门经典——C#编程人员必备的XML技能

    XML入门视频教程.rar

    XML入门视频教程.rar

    XML基础及Tinyxml入门

    XML基础及Tinyxml入门 xml读写 XML基础及Tinyxml入门 xml读写XML基础及Tinyxml入门 xml读写XML基础及Tinyxml入门 xml读写XML基础及Tinyxml入门 xml读写XML基础及Tinyxml入门 xml读写XML基础及Tinyxml入门 xml读写

    XML入门经典 第5版 第五版 中文 扫描版 pdf

    XML入门经典 第5版 第五版 中文 扫描版 pdf 完整版 完整版

    XML入门经典(第4版)-ChinaPub畅销书-XML开发必备

    1.本书是学习XML的优秀入门教程,自第1版出版以来,一直广受程序员欢迎。. 2.本书分8个专题,全面清晰地说明了XML是什么,XML的用法以及与它相关的技术。.. 3.本书适用任何对XML用法感兴趣的程序员使用,也适合...

    XML入门教程

    XML入门,XML入门教程,很适合初学者使用。这是疯狂XML讲义的另一部分,因上传文件大小限制,只能分成两部分了,切记同时下完这两个,否则是不能用的。

    XML入门经典(第五版)

     使用XML可以做太多的事情,从简单的数据传输到提供多通道的内容,《XML入门经典(第5版)》将帮助你开启XML之旅。它将带领你饱览一切你需要知道的有关这门强大语言的知识,包括它是什么,它如何工作,与之相关的...

Global site tag (gtag.js) - Google Analytics