本篇文章给大家谈谈javasax解析,以及java sax解析xml对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
本文目录一览:
1、java的sax解析xml文件 有大小限制没2、求java解析xml文档的sax方法3、java解析xml有几种方法4、java解析xml的几种方式哪种最好?
java的sax解析xml文件 有大小限制没
szx解析xml文件,对文件的大小没有限制,但是由于解析的过程是需要分配系统内存的,如果内存不够,可能会造成内存溢出的系统异常。
求java解析xml文档的sax方法
ava的sax解析是基于事件的解析:当解析到xml的某个部分的时候,会触发特定事件,可以在自定义的解析类中定义当事件触发时要做得事情。
我们可以继承org.xml.sax.helpers.DefaultHandler类(该类是org.xml.sax.helpers.ContentHandler的接口实现类)来覆盖ContentHandler接口的各种方法,这些方法将定义各个事件所触发的程序动作。
package com.thomas.xml.sax;
import org.xml.sax.Attributes;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class ThomasSAXHandler extends DefaultHandler {
private StringBuffer xml;//格式化后的XML文件内容
private static int step = 0;//元素层次
public ThomasSAXHandler(){
this.xml = new StringBuffer();
}
public StringBuffer getXml() {
return xml;
}
public void setXml(StringBuffer xml) {
this.xml = xml;
}
/**
* 给字符串添加TAB,使其能格式化输出,在这里第step层元素缩进step个Tab
*/
private void appendTab(){
for(int i = 1 ; istep; i++){
for(int j = 0 ;j4; j++){
xml.append(‘ ‘);
}
}
}
/**
* 接收元素中字符数据的通知。
* @param ch – 字符。
* @param start – 字符数组中的开始位置。
* @param length – 从字符数组中使用的字符数。
*/
public void characters(char[] ch, int start, int length) throws SAXException {
String text = new String(ch,start,length);
text = text.trim();
if(!text.equals(“”)){
step++;
appendTab();
xml.append(text).append(“\r\n”);
step–;
}
}
/**
* 接收文档的结尾的通知。
* @exception SAXException – 任何 SAX 异常,可能包装另外的异常。
*/
public void endDocument() throws SAXException {
// TODO Auto-generated method stub
}
/**
* 接收元素结束的通知
* @param uri – 名称空间 URI,如果元素没有任何名称空间 URI,或者没有正在执行名称空间处理,则为空字符串。
* @param localName – 本地名称(不带前缀),如果没有正在执行名称空间处理,则为空字符串。
* @param qName – 限定的名称(带有前缀),如果限定的名称不可用,则为空字符串。
* @exception SAXException – 任何 SAX 异常,可能包装另外的异常。
*/
public void endElement(String uri, String localName, String qName) throws SAXException {
appendTab();
xml.append(“/”);
if(!uri.equals(“”)){
xml.append(uri+”:”);
}
xml.append(qName).append(“\r\n”);
step–;
}
/**
* 结束前缀 URI 范围的映射。
* @param prefix – 被映射的前缀。当默认的映射范围结束时,这是一个空字符串。
* @exception SAXException – 客户端可能会在处理期间抛出一个异常
*/
public void endPrefixMapping(String prefix) throws SAXException {
// TODO Auto-generated method stub
}
/**
* 接收元素内容中可忽略的空白的通知。
* @param ch 来自 XML 文档的字符
* @param start 数组中的开始位置
* @param length 从数组中读取的字符的个数
* @exception SAXException – 任何 SAX 异常,可能包装另外的异常
*/
public void ignorableWhitespace(char[] ch, int start, int length) throws SAXException {
// TODO Auto-generated method stub
}
/**
* 接收处理指令的通知。
* @param target 处理指令目标
* @param data 处理指令数据,如果未提供,则为 null。该数据不包括将其与目标分开的任何空白
*/
public void processingInstruction(String target, String data) throws SAXException {
// TODO Auto-generated method stub
}
/**
* 接收用来查找 SAX 文档事件起源的对象
* @param locator 可以返回任何 SAX 文档事件位置的对象
*/
public void setDocumentLocator(Locator locator) {
// TODO Auto-generated method stub
}
/**
* 接收跳过的实体的通知。将不为标记结构(如元素开始标记或标记声明)内的实体引用调用此方法。(XML 建议书要求报告所跳过的外部实体。SAX 还报告内部实体扩展 / 非扩展,但不包括在标记结构内部。)
* @param name – 所跳过的实体的名称。如果它是参数实体,则名称将以 ‘%’ 开头,如果它是外部 DTD 子集,则将是字符串 “[dtd]”
* @exception SAXException – 任何 SAX 异常,可能包装另外的异常
*/
public void skippedEntity(String name) throws SAXException {
// TODO Auto-generated method stub
}
/**
* 接收文档的开始的通知
* @exception – SAXException – 任何 SAX 异常,可能包装另外的异常
*/
public void startDocument() throws SAXException {
// TODO Auto-generated method stub
}
/**
* 接收元素开始的通知。
* @param uri – 名称空间 URI,如果元素没有任何名称空间 URI,或者没有正在执行名称空间处理,则为空字符串。
* @param localName – 本地名称(不带前缀),如果没有正在执行名称空间处理,则为空字符串。
* @param qName – 限定的名称(带有前缀),如果限定的名称不可用,则为空字符串。
* @param attributes – 附加到元素的属性。如果没有属性,则它将是空的 Attributes 对象。
* @exception SAXException – 任何 SAX 异常,可能包装另外的异常
*/
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
step++;//元素层次加一
appendTab();
xml.append(“”);
if(!uri.equals(“”)){
xml.append(uri+”:”);
}
xml.append(qName);
for(int i = 0, size = attributes.getLength(); isize; i++){
xml.append(‘ ‘).append(attributes.getQName(i)).append(“=\””).append(attributes.getValue(i)).append(“\””);
}
xml.append(“\r\n”);
}
/**
* 开始前缀 URI 名称空间范围映射。
* @param prefix – 声明的名称空间前缀。对于没有前缀的默认元素名称空间,使用空字符串。
* @param uri – 将前缀映射到的名称空间 URI
* @exception – SAXException – 客户端可能会在处理期间抛出一个异常
*/
public void startPrefixMapping(String prefix, String uri) throws SAXException {
// TODO Auto-generated method stub
}
}
上面是我们自定义的解析器,可以在带有main方法的类中加以测试
package com.thomas.xml.sax;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.InputSource;
public class Test {
public static void main(String[] args){
try{
SAXParserFactory sf = SAXParserFactory.newInstance();
SAXParser sp = sf.newSAXParser();
ThomasSAXHandler handler = new ThomasSAXHandler();
sp.parse(new InputSource(“film.xml”),handler);
System.out.println(handler.getXml());
}
catch(Exception e){
e.printStackTrace();
}
}
}
下面是film.xml
?xml version=”1.0″ encoding=”gb2312″?
Kungfu-vips
vip
name lang=”en,ch”Bruce Li/name
age32/age
sexmale/sex
/vip
vip
name lang=”en,ch”Jakie Chen/name
age39/age
sexmale/sex
/vip
vip
name lang=”en,ch”Jet Li/name
age39/age
sexmale/sex
/vip
/Kungfu-vips
运行test类,可以看到输出结果:
Kungfu-vips
vip
name lang=”en,ch”
Bruce Li
/name
age
32
/age
sex
male
/sex
/vip
vip
name lang=”en,ch”
Jakie Chen
/name
age
39
/age
sex
male
/sex
/vip
vip
name lang=”en,ch”
Jet Li
/name
age
39
/age
sex
male
/sex
/vip
/Kungfu-vips
java解析xml有几种方法
DOM(Document Object Model)解析
优点
允许应用程序对数据和结构做出更改
访问是双向的,可以在任何时候在树中上、下导航获取、操作任意部分的数据
缺点
解析XML文档的需要加载整个文档来构造层次结构,消耗内存资源大。
应用范围
遍历能力强,常应用于XML文档需要频繁改变的服务中。
解析步骤
创建一个 DocumentBuilderFactory 对象
创建一个 DocumentBuilder 对象
通过 DocumentBuilder 的 parse() 方法加载 XML 到当前工程目录下
通过 getElementsByTagName() 方法获取所有 XML 所有节点的集合
遍历所有节点
通过 item() 方法获取某个节点的属性
通过 getNodeName() 和 getNodeValue() 方法获取属性名和属性值
通过 getChildNodes() 方法获取子节点,并遍历所有子节点
通过 getNodeName() 和 getTextContent() 方法获取子节点名称和子节点值
package Paint;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DOMTest {
public static void main(String[] args) {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse(“./src/Paint/hello.xml”);
NodeList bookList = document.getElementsByTagName(“book”); //节点集
int bookCnt = bookList.getLength();
System.err.println(“一共获取到” + bookCnt +”本书”);
for(int i=0; i Node book = bookList.item(i);
NamedNodeMap attrs = book.getAttributes();
for(int j=0; j Node attr = attrs.item(j);
System.err.println(attr.getNodeName()+”—“+attr.getNodeValue());//id
}
NodeList childNodes = book.getChildNodes();
for(int k=0; k if(childNodes.item(k).getNodeType() == Node.ELEMENT_NODE){
System.out.println(childNodes.item(k).getNodeName()+”—” + childNodes.item(k).getTextContent());
}
}
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
SAX(Simple API for XML)解析
优点
不需要等待所有的数据被处理,解析就可以开始
只在读取数据时检查数据,不需要保存在内存中
可以在某一个条件满足时停止解析,不必要解析整个文档
效率和性能较高,能解析大于系统内存的文档
缺点
解析逻辑复杂,需要应用层自己负责逻辑处理,文档越复杂程序越复杂
单向导航,无法定位文档层次,很难同时同时访问同一文档的不同部分数据,不支持 XPath
解析步骤
获取一个 SAXParserFactory 的实例
通过 factory() 获取 SAXParser 实例
创建一个 handler() 对象
通过 parser 的 parse() 方法来解析 XML
SAXTest.java
package Paint;
import java.io.IOException;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.SAXException;
public class SAXTest {
public static void main(String[] args) {
// 获取实例
SAXParserFactory factory = SAXParserFactory.newInstance();
try {
SAXParser parser = factory.newSAXParser();
SAXParserHandler handler = new SAXParserHandler();
parser.parse(“./src/Paint/hello.xml”, handler);
System.err.println(“共有”+ handler.getBookList().size()+ “本书”);
for(Book book : handler.getBookList()){
System.out.println(book.getName());
System.out.println(“id=” + book.getId());
System.out.println(book.getAuthor());
System.out.println(book.getYear());
System.out.println(book.getPrice());
System.out.println(book.getLanguage());
}
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
SAXParserHandler.java
package Paint;
import java.util.ArrayList;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class SAXParserHandler extends DefaultHandler {
String value = null;
Book book = null;
private ArrayList bookList = new ArrayList();
public ArrayList getBookList() {
return bookList;
}
/*
* XML 解析开始
*/
public void startDocument() throws SAXException {
super.startDocument();
System.out.println(“xml 解析开始”);
}
/*
* XML 解析结束
*/
public void endDocument() throws SAXException {
super.endDocument();
System.out.println(“xml 解析结束”);
}
/*
* 解析 XML 元素开始
*/
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
super.startElement(uri, localName, qName, attributes);
if(qName.equals(“book”)){
book = new Book();
for(int i=0; i System.out.println(attributes.getQName(i)+”—“+attributes.getValue(i));
if(attributes.getQName(i).equals(“id”)){
book.setId(attributes.getValue(i));
}
}
}else if(!qName.equals(“bookstore”)){
System.out.print(“节点名:”+ qName + “—“);
}
}
/*
*解析 XML 元素结束
*/
public void endElement(String uri, String localName, String qName)
throws SAXException {
super.endElement(uri, localName, qName);
if(qName.equals(“book”)){
bookList.add(book);
book = null;
}
else if(qName.equals(“name”)){
book.setName(value);
}else if(qName.equals(“year”)){
book.setYear(value);
}else if(qName.equals(“author”)){
book.setAuthor(value);
}else if(qName.equals(“price”)){
book.setPrice(value);
}else if(qName.equals(“language”)){
book.setLanguage(value);
}
}
public void characters(char[] ch, int start, int length)
throws SAXException {
super.characters(ch, start, length);
// 获取节点值数组
value = new String(ch, start, length);
if(!value.trim().equals(“”)){
System.out.println(“节点值:”+value);
}
}
}
java解析xml的几种方式哪种最好?
(1)DOM解析
DOM是html和xml的应用程序接口(API),以层次结构(类似于树型)来组织节点和信息片段,映射XML文档的结构,允许获取;
(2)SAX(Simple API for XML)解析
流模型中的”推”模型分析方式。通过事件驱动,每发现一个节点就引发一个事件,事件推给事件处理器,通过回调方法;
(1)、dom解析
dom解析是html和xml的应用程序接口(api) 以层次结构(类似与树形)来组织节点 和信息片段 映射xml文档的结构 允许获取和操作文档的任意部分 是官方标准
(2)、sax解析
流模型中in个的 推 模型 分析方式 通过事件驱动 没发现一个节点就引发一个事件 事件推给事件处理期 遍历回调方法
(3)、stax
流模型中的拉模型分析方式 提供基于指针和基于迭代器两种方式 的支持1.6新特征
(4)、jdom
java特定的文档对象模型 自身不包含解析器 使用sax
(5)、jdom4j
简单易用 采用java集合框架 兵完全支持dom sax 和jaxp
关于javasax解析和java sax解析xml的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。