跟HTML一样,XML元素再开始标记处可以由元素属性。

属性通常包含一些关于元素的额外信息。


XML属性

XML元素可以拥有属性。

你一定还记得这样的HTML代码吧: <IMG SRC="computer.gif">。src是img元素的属性,提供了关于img元素的额外信息。

在HTML中 (在XML中也一样)元素的属性提供了元素的额外信息。

<img src="computer.gif">
<a href="demo.asp">

书信提供的信息通常不是数据的一部分。在下面的例子中,类型和数据毫不相关,但对于操作这个元素的软件来说却相当重要。

<file type="gif">computer.gif</file>


引用风格"female" 还是 'female'?

属性值必须用引号引着。单引号、双引号都可以使用。例如一个人的性别,person元素可以这样写:

<person sex="female">

也可以这样写:

<person sex='female'>

上面的两种写法在一般情况下是没有区别的,使用双引号的应用更普遍一些。但是在某些特殊的情况下就必须使用单引号,比如下面的例子:

<gangster name='George "Shotgun" Ziegler'>
 

使用子元素还是使用属性

数据既可以存储在子元素中也可以存储在属性中。

请看下面的例子:

<person sex="female">
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>

<person>
<sex>female</sex>
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>

在第一个例子中,sex是一个属性,在第二个例子中,sex则是一个子元素。这两个例子都提供了相同的信息。

什么时候用属性,什么时候用子元素没有一个现成的规则可以遵循。我的经验是属性在HTML中可能相当便利,但在XML中,你最好避免使用。


我喜欢的风格

我更愿意把数据存储到子元素中。

下面的三个XML文档包含了相同的信息:

第一个例子使用了data属性:

<note date="12/11/99">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

第二个例子使用了data元素:

<note>
<date>12/11/99</date>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>

第三个例子使用了扩展的data元素: (这就是我推荐的样式):

<note>
<date>
<day>12</day>
<month>11</month>
<year>99</year>
</date>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note> 


避免使用属性?

应该避免使用属性么?

这里有一些使用属性引发的问题:

  • 属性不能包含多个值(子元素可以)。
  • 属性不容易扩展。
  • 属性不能够描述结构(子元素可以)。
  • 属性很难被程序代码处理。
  • 属性值很难通过DTD进行测试。

如果使用属性来存储数据,那么所编写的XML文档一定很难阅读和操作。尽量使用元素来描述数据,仅使用属性来描述那些与数据关系不大的额外信息。

不要象下面的例子那样(如果你那么做了说明你还没有明白上面的观点)。

<note day="12" month="11" year="99"
to="Tove" from="Jani" heading="Reminder" 
body="Don't forget me this weekend!">
</note> 


属性规则的例外

规则总是有例外的。

我的关于属性的规则也有一个例外:

有些时候应该为一个元素设计一个ID引用,通过这个ID可以引用存取特定的XML元素,就象HTML中的name和id属性一样。请看下面的例子:

<messages>
<note ID="501">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
<note ID="502">
<to>Jani</to>
<from>Tove</from>
<heading>Re: Reminder</heading>
<body>I will not!</body>
</note> 
</messages>

在上面的例子中,ID属性就相当于一个计数器,或者是一个唯一的标识符,在XML文档中标识不同的便条信息,他不是便条信息的一部分。

我们所要尽力向读者说明的是:元数据(与数据有关的数据)应该以属性的方式存储,而数据本身应该以元素的形式存储。