Java更新XML的四种常用方法简介2

时间:2007-10-06 00:50:08   来源:  作者:ChinaITzhe  编辑:海

OutputKeys类

javax.xml.transform.OutputKeys类和java.util.Properties类配合使用,可以控制JAXP的XSLT引擎(Transformer类)输出XML文档的格式。请看下面的代码片断:

//首先创建一个TransformerFactory对象,再由此创建Transformer对象。

TransformerFactory tf=TransformerFactory.newInstance();

Transformer t=tf.newTransformer ();

//获取Transformser对象的输出属性,亦即XSLT引擎的缺省输出属性,这是一个

//java.util.Properties对象。

Properties properties = t.getOutputProperties();

//设置新的输出属性:输出字符编码为GB2312,这样可以支持中文字符,XSLT引擎所输出

//的XML文档如果包含了中文字符,可以正常显示,不会出现所谓的"汉字问题"。

//请留意OutputKeys类的字符串常数OutputKeys.ENCODING。

properties.setProperty(OutputKeys.ENCODING,"GB2312");

/更新XSLT引擎的输出属性。

t.setOutputProperties(properties);

//调用XSLT引擎,按照输出属性中的设置,输出DOM Tree中的内容到输出介质中。

t.transform(DOMSource_Object,StreamResult_Object);

从上面的程序代码,我们不难看出,通过设置XSLT引擎(Transformer类)的输出属性,可以控制DOM Tree中的内容的输出格式,这对于我们定制输出内容是很有帮助的。那么JAXP的XSLT引擎(Transformer类)有那些输出属性可以设置呢? javax.xml.transform.OutputKeys类定义了很多字符串常数,它们都是可以自由设置的输出属性,常用的输出属性如下所示:

public static final java.lang.String METHOD

可以设为"xml"、"html"、"text"等值。

public static final java.lang.String VERSION

所遵循规范的版本号,如果METHOD设为"xml",那么它的值应该设为"1.0",如果METHOD设为"html",那么它的值应该设为"4.0",如果METHOD设为"text",那么这个输出属性会被忽略。

public static final java.lang.String ENCODING

设置输出时所采用的编码方式,比如"GB2312"、"UTF-8"等等,如果将其设置为"GB2312",可以解决所谓的"汉字问题"。

public static final java.lang.String OMIT_XML_DECLARATION

设置输出到XML文档中时是否忽略XML声明,亦即类似于:

<?xml version="1.0" standalone="yes" encoding="utf-8" ?>

这样的代码。它可选的值有"yes"、"no"。

public static final java.lang.String INDENT

IDENT设定XSLT引擎在输出XML文档时,是否自动添加额外的空格,它可选的值为"yes"、"no"。

public static final java.lang.String MEDIA_TYPE

MEDIA_TYPE设定输出文档的MIME类型。

如果设定XSLT引擎的输出属性呢?下面我们来总结一下:

首先是获取XSLT引擎(Transformer类)的缺省输出属性的集合,这需要使用Transformer类的getOutputProperties()方法,返回值是一个java.util.Properties对象。

Properties properties = transformer.getOutputProperties();

然后是设定新的输出属性,比如:

properties.setProperty(OutputKeys.ENCODING,"GB2312");

properties.setProperty(OutputKeys.METHOD,"html");

properties.setProperty(OutputKeys.VERSION,"4.0");

………………………………………………………

最后是更新XSLT引擎(Transformer类)的缺省输出属性的集合,这需要使用Transformer类的setOutputProperties()方法,参数是一个java.util.Properties对象。

我们编写了一个新的程序,其中应用了OutputKeys类,用以控制XSLT引擎的输出属性,该程序的架构和前一个程序(AddRecord3.java)大致相同,不过输出结果略有不同。完整的代码请参考下列文件: AddRecord3.java(见附件)、user.xml(见附件)。该例子的运行环境为:Windows XP Professional、JDK 1.3.1。为了能够正常编译运行AddRecord3.java这个程序,你需要到网址http://java.sun.com去下载安装JAXP 1.1或者Java XML Pack(Java XML Pack内含JAXP了)。

方法四:使用Xalan XML Serializer

方法四其实是方法三的一个变种,它需要Apache Xalan和Apache Xerces的支持才能够运行。例子代码如下所示:

//首先创建一个DOMSource对象,该构造函数的参数可以是一个Document对象

//doc代表更改后的DOM Tree。

DOMSource domSource = new DOMSource (doc);

//创建一个DOMResult对象,临时保存XSLT引擎的输出结果。

DOMResult domResult = new DOMResult();

//下面调用JAXP中的XSLT引擎来实现输出DOM Tree中的数据到XML文件中的功能。

//XSLT引擎的输入为DOMSource对象,输出为DOMResut对象。

try

{

//首先创建一个TransformerFactory对象,再由此创建Transformer对象。Transformer

//类相当于一个XSLT引擎。通常我们使用它来处理XSL文件,但是在这里我们使

//用它来输出XML文档。

TransformerFactory tf=TransformerFactory.newInstance();

Transformer t=tf.newTransformer ();

//设置XSLT引擎的属性(必不可少,否则会产生"汉字问题")。

Properties properties = t.getOutputProperties();

properties.setProperty(OutputKeys.ENCODING,"GB2312");

t.setOutputProperties(properties);

//关键的一步, 调用Transformer对象 (XSLT引擎)的transform()方法,该方法的第一

//个参数是DOMSource对象,第二个参数是DOMResult对象。

t.transform(domSource,domResult);

//创建缺省的Xalan XML Serializer,使用它将临时存放在DOMResult对象

//(domResult)中的内容以输出流的形式输出到输出介质中。

Serializer serializer = SerializerFactory.getSerializer

(OutputProperties.getDefaultMethodProperties("xml"));

//设置Xalan XML Serializer的输出属性,这一步必不可少,否则也可能产生

//所谓的"汉字问题"。

Properties prop=serializer.getOutputFormat();

prop.setProperty("encoding","GB2312");

serializer.setOutputFormat(prop);

//创建一个File对象,代表DOM Tree所包含的数据的输出介质,这是一个XML文件。

File f = new File ("xuser3.xml");

//创建文件输出流对象fos,请留意构造函数的参数。

FileOutputStream fos=new FileOutputStream(f);

//设置Xalan XML Serializer的输出流。

serializer.setOutputStream(fos);

//串行化输出结果。

serializer.asDOMSerializer().serialize(domResult.getNode());

}

catch (Exception tce)

{

tce.printStackTrace();

}

这个方法不太常用,而且似乎有点画蛇添足,所以我们就不展开讨论了。完整的例子请参考下列文件: AddRecord4.java(见附件)、user.xml(见附件)。该例子的运行环境为:Windows XP Professional、JDK 1.3.1。为了能够正常编译运行AddRecord4.java这个程序,你需要到网址http://xml.apache.org/dist/去下载安装Apache Xalan和Apache Xerces。

或者是到网址http://java.sun.com/xml/download.html去下载安装Java XML Pack。因为最新的Java XML Pack(Winter 01 版)包含了Apache Xalan和Apache Xerces技术在内。

结论:

本文简略的讨论了Java语言编程中更新XML文档的四种方法。第一种方法是直接读写XML文件,这种方法十分繁琐,而且比较容易出错,极少使用,除非你需要开发自己的XML Parser,否则不会使用这种方法。第二种方法是使用Apache Crimson的XmlDocument类,这种方法极为简单,使用方便,如果你选用Apache Crimson作为XML解析器,那么不妨使用这种方法,不过这种方法似乎效率不高(源于效率低下的Apache Crimson),另外,高版本的JAXP或者是Java XML Pack、JWSDP不直接支持Apache Crimson,亦即这种方法不通用。第三种方法是使用JAXP的XSLT引擎(Transformer类)来输出XML文档,这种方法也许是标准的方法了,使用起来十分灵活,特别是可以自如控制输出格式,我们推荐采用这种方法。第四种方法是第三种方法的变种,采用了Xalan XML Serializer,引入了串行化操作,对于大量文档的修改/输出有优越性,可惜的是要重复设置XSLT引擎的属性和XML Serializer的输出属性,比较麻烦,而且依赖于Apache Xalan和Apache Xerces技术,通用性略显不足。

除了上面讨论的四种方法以外,实际上应用别的API(比如JDOM、Castor、XML4J、Oracle XML Parser V2)也有很多办法可以更新XML文档,限于篇幅,在这里就不一一讨论了。

关键字:Java,xml,技术

相关文章

文章评论

共有 0 位网友发表了评论 此处只显示部分留言 点击查看完整评论页面