怎么解析xml文件，java解析xml文件的几种方式-励北网

怎么解析xml文件，java解析xml文件的几种方式

怎么解析xml文件，java解析xml文件的几种方式

一、为什么使用xml文件

便于不同应用程序之间通信。
便于不同平台之间通信。
便于不同平台之间数据共享。

二、读取xml的方式

xml测试文件内容如下：

<?xml version="1.0" encoding="UTF-8"?> <studentInfo> <student id="1"> <name>小明</name> <age>28</age> <birthday>19920114</birthday> <home>河南</home> </student> <student id="2"> <name>小刚</name> <age>29</age> <birthday>19911114</birthday> <home>湖北</home> </student> <student id="3"> <name>小红</name> <age>28</age> <birthday>19920115</birthday> <home>湖南</home> </student> </studentInfo>

2.1 dom方式读取

dom方式读取xml文件具体源代码如下：

package basic; import org.w3c.dom.Document; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; public class ReadXmlDomService { public static void main(String[] args){ System.out.println("readXmlByDom start:"); readXmlByDom(); System.out.println("readXmlByDom end."); } //dom方式 private static void readXmlByDom(){ try { // 创建解析器工厂 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder db = factory.newDocumentBuilder(); // 创建一个Document对象 Document doc = db.parse("/Users/liuxiaoming/Desktop/test.xml"); NodeList studentList = doc.getElementsByTagName("student"); // 获取节点个数 System.out.println("一共有" + studentList.getLength() + "同学"); // 遍历每个student节点 for (int i = 0; i < studentList.getLength(); i++) { System.out.println("*******************************"); // 索引从零开始 org.w3c.dom.Node student = studentList.item(i); // 获取student节点所有属性集合 org.w3c.dom.NamedNodeMap attrs = student.getAttributes(); System.out.println("第" + (i + 1) + "个同学共有" + attrs.getLength() + "属性"); // 遍历student属性，不知道节点属性和属性名情况 for (int j = 0; j < attrs.getLength(); j++) { // 获取某一个属性 org.w3c.dom.Node attr = attrs.item(j); System.out.print("属性名:" + attr.getNodeName()); System.out.println(" --- 属性值:" + attr.getNodeValue()); } // 若已经知道student节点有且只有1个ID属性,可用以下方式 // org.w3c.dom.Element e = (org.w3c.dom.Element) // bookList.item(i); // System.out.println("Element属性值:"+e.getAttribute("id")); NodeList childNodes = student.getChildNodes(); for (int k = 0; k < childNodes.getLength(); k++) { // 区分,去掉空格和换行符 if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) { // 获取element类型的节点和节点值 System.out.print("节点名：" + childNodes.item(k).getNodeName()); System.out.print(" --- 节点值：" + childNodes.item(k).getFirstChild().getNodeValue()); System.out.println(" --- 节点值："+childNodes.item(k).getTextContent()); } } } } catch (Exception e) { e.printStackTrace(); } } }

运行结果：

readXmlByDom start: 一共有3同学 ******************************* 第1个同学共有1属性属性名:id --- 属性值:1 节点名：name --- 节点值：小明 --- 节点值：小明节点名：age --- 节点值：28 --- 节点值：28 节点名：birthday --- 节点值：19920114 --- 节点值：19920114 节点名：home --- 节点值：河南 --- 节点值：河南 ******************************* 第2个同学共有1属性属性名:id --- 属性值:2 节点名：name --- 节点值：小刚 --- 节点值：小刚节点名：age --- 节点值：29 --- 节点值：29 节点名：birthday --- 节点值：19911114 --- 节点值：19911114 节点名：home --- 节点值：湖北 --- 节点值：湖北 ******************************* 第3个同学共有1属性属性名:id --- 属性值:3 节点名：name --- 节点值：小红 --- 节点值：小红节点名：age --- 节点值：28 --- 节点值：28 节点名：birthday --- 节点值：19920115 --- 节点值：19920115 节点名：home --- 节点值：湖南 --- 节点值：湖南 readXmlByDom end.

2.2 dom4j方式

dom4j方式需要引入dom4j依赖包

maven依赖项：

java源码如下：

package basic; import org.dom4j.Attribute; import org.dom4j.Document; import org.dom4j.Element; import org.dom4j.io.SAXReader; import java.io.File; import java.util.Iterator; import java.util.List; public class ReadXmlDom4jService { public static void main(String[] args){ System.out.println("readXmlByDom4j start:"); readXmlByDom4j(); System.out.println("readXmlByDom4j end."); } //dom4j方式 private static void readXmlByDom4j(){ try { // 创建SAXReader对象 SAXReader reader = new SAXReader(); // 加载xml文件 Document dc= reader.read(new File("/Users/liuxiaoming/Desktop/test.xml")); // 获取根节点 Element e = dc.getRootElement(); // 获取迭代器 Iterator it = e.elementIterator(); // 遍历迭代器，获取根节点信息 while(it.hasNext()){ Element studentInfo = (Element) it.next(); List<Attribute> atts= studentInfo.attributes(); // 获取student属性名和属性值 for (Attribute att : atts) { System.out.println("节点名："+att.getName()+"节点值："+att.getValue()); } Iterator itt = studentInfo.elementIterator(); while(itt.hasNext()){ Element b = (Element) itt.next(); System.out.println("属性名："+b.getName()+"属性值："+b.getText()); } } } catch (Exception e) { // TODO: handle exception } } }

运行结果：

readXmlByDom4j start: 节点名：id节点值：1 属性名：name属性值：小明属性名：age属性值：28 属性名：birthday属性值：19920114 属性名：home属性值：河南节点名：id节点值：2 属性名：name属性值：小刚属性名：age属性值：29 属性名：birthday属性值：19911114 属性名：home属性值：湖北节点名：id节点值：3 属性名：name属性值：小红属性名：age属性值：28 属性名：birthday属性值：19920115 属性名：home属性值：湖南 readXmlByDom4j end.

2.3 jdom方式

使用jdom方式需要引入相关maven依赖

jdom方式导入源码如下：

package basic; import org.jdom.Attribute; import org.jdom.Document; import org.jdom.Element; import org.jdom.input.SAXBuilder; import java.io.FileInputStream; import java.io.InputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.List; public class ReadXmlJdomService { public static void main(String[] args){ System.out.println("readXmlByJdom start:"); readXmlByJdom(); System.out.println("readXmlByJdom end."); } //jdom方式 private static void readXmlByJdom(){ List<Student> bList = new ArrayList<Student>(); try { // 创建一个SAXBuilder对象 SAXBuilder builder = new SAXBuilder(); // 创建一个输入流 InputStream in = new FileInputStream("/Users/liuxiaoming/Desktop/test.xml"); // 处理乱码情况 InputStreamReader isr = new InputStreamReader(in, "UTF-8"); // 通过build方法，将输入流加载到SAXBuilder中 Document doc = builder.build(isr); // 通过Document对象获取根节点 Element foo= doc.getRootElement(); // 获取根节点下子节点名 List<Element> allChildren = foo.getChildren(); // 进行解析 for (Element student : allChildren) { Student b = new Student(); System.out.println("开始解析第"+(allChildren.indexOf(student)+1)+"个同学"); // 解析student属性集合 List<Attribute> attrList = student.getAttributes(); // 遍历(针对不清楚节点下属性名) for (Attribute attr : attrList) { System.out.println("属性名："+attr.getName() +" -- 属性值："+attr.getValue()); if("id".equals(attr.getName())){ b.setId(attr.getValue()); } } // 清楚知道属性名获取属性值 String v = student.getAttributeValue("id"); System.out.println("清楚知道属性名"+v); // 对student节点子节点的节点名和节点值进行遍历 List<Element> studentChiles = student.getChildren(); for (Element element : studentChiles) { System.out.println("属性名："+element.getName() +" -- 属性值："+element.getValue()); if("name".equals(element.getName())){ b.setName(element.getValue()); }else if("age".equals(element.getName())){ b.setAge(element.getValue()); }else if("home".equals(element.getName())){ b.setHome(element.getValue()); }else if("birthday".equals(element.getName())){ b.setBirthday(element.getValue()); }else if("id".equals(element.getName())){ b.setId(element.getValue()); } } System.out.println("结束解析第"+(allChildren.indexOf(student)+1)+"个同学"); bList.add(b); b = null; } } catch (Exception e) { e.printStackTrace(); } } }

运行结果：

readXmlByJdom start: 开始解析第1个同学属性名：id -- 属性值：1 清楚知道属性名1 属性名：name -- 属性值：小明属性名：age -- 属性值：28 属性名：birthday -- 属性值：19920114 属性名：home -- 属性值：河南结束解析第1个同学开始解析第2个同学属性名：id -- 属性值：2 清楚知道属性名2 属性名：name -- 属性值：小刚属性名：age -- 属性值：29 属性名：birthday -- 属性值：19911114 属性名：home -- 属性值：湖北结束解析第2个同学开始解析第3个同学属性名：id -- 属性值：3 清楚知道属性名3 属性名：name -- 属性值：小红属性名：age -- 属性值：28 属性名：birthday -- 属性值：19920115 属性名：home -- 属性值：湖南结束解析第3个同学 readXmlByJdom end.

2.4 Sax方式

Sax方式解析xml文件源码如下：

package basic; import java.util.ArrayList; import java.util.List; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class SAXParserHandler extends DefaultHandler { int studentIndex = 0; String str = null; Student student = null; private List<Student> stuList = new ArrayList<Student>(); public List<Student> getStuList() { return stuList; } /** * 用来遍历xml文件的开始标签 */ @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { // 调用DefaultHandler的startElement方法 super.startElement(uri, localName, qName, attributes); // 开始解析student元素属性 if(qName.equals("student")){ studentIndex++; // 创建一个student对象 student = new Student(); System.out.println("****开始第"+ studentIndex +"个同学内容****"); // 已知student元素下属性名称，根据属性名称获取属性值s String value = attributes.getValue("id"); System.out.println("student的属性值是："+value); int num = attributes.getLength(); for(int i=0;i<num;i++){ System.out.print("student元素的第"+(i+1)+"个属性名是："+attributes.getQName(i)); System.out.println(" -- 属性值是："+attributes.getValue(i)); if(attributes.getQName(i).equals("id")){ student.setId(attributes.getQName(i)); } } }else if(!qName.equals("student") && !qName.equals("studentInfo")){ System.out.print("节点名是："+qName); } } /** * 用来遍历xml文件的结束标签 */ @Override public void endElement(String uri, String localName, String qName) throws SAXException { // 调用DefaultHandler的endElement方法 super.endElement(uri, localName, qName); // 判断是否针对一本书已经遍历结束 if(qName.equals("student")){ stuList.add(student); student = null; System.out.println("****结束第"+ studentIndex +"个同学内容****"); }else if(qName.equals("name")){ student.setName(str); }else if(qName.equals("id")){ student.setId(str); }else if(qName.equals("age")){ student.setAge(str); }else if(qName.equals("birthday")){ student.setBirthday(str); }else if(qName.equals("home")){ student.setHome(str); } } /** * 用来标志解析开始 */ @Override public void startDocument() throws SAXException { // 调用DefaultHandler的startDocument方法 super.startDocument(); System.out.println("解析开始"); } /** * 用来标志解析结束 */ @Override public void endDocument() throws SAXException { // 调用DefaultHandler的endDocument方法 super.endDocument(); System.out.println("解析结束"); } /** * 用来标志解析结束 */ @Override public void characters(char[] ch, int start, int length) throws SAXException { // 调用DefaultHandler的characters方法 super.characters(ch, start, length); str = new String(ch, start, length); if(!str.trim().equals("")){ System.out.println(" -- 节点值是："+str); } } }

package basic; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; public class ReadXmlSaxService { public static void main(String[] args){ System.out.println("readXmlByJdom start:"); readXmlBySax(); System.out.println("readXmlByJdom end."); } private static void readXmlBySax(){ try { // 创建工厂 SAXParserFactory sf=SAXParserFactory.newInstance(); // 获取SAXParser实例 SAXParser sp = sf.newSAXParser(); // 创建一个解析对象 SAXParserHandler handler = new SAXParserHandler(); sp.parse("/Users/liuxiaoming/Desktop/test.xml", handler); for(Student student : handler.getStuList()){ System.out.println(student.getId()); System.out.println(student.getName()); System.out.println(student.getAge()); System.out.println(student.getBirthday()); System.out.println(student.getHome()); System.out.println("*****************"); } } catch (Exception e) { e.printStackTrace(); } } }

运行结果：

readXmlByJdom start: 解析开始 ****开始第1个同学内容**** student的属性值是：1 student元素的第1个属性名是：id -- 属性值是：1 节点名是：name -- 节点值是：小明节点名是：age -- 节点值是：28 节点名是：birthday -- 节点值是：19920114 节点名是：home -- 节点值是：河南 ****结束第1个同学内容**** ****开始第2个同学内容**** student的属性值是：2 student元素的第1个属性名是：id -- 属性值是：2 节点名是：name -- 节点值是：小刚节点名是：age -- 节点值是：29 节点名是：birthday -- 节点值是：19911114 节点名是：home -- 节点值是：湖北 ****结束第2个同学内容**** ****开始第3个同学内容**** student的属性值是：3 student元素的第1个属性名是：id -- 属性值是：3 节点名是：name -- 节点值是：小红节点名是：age -- 节点值是：28 节点名是：birthday -- 节点值是：19920115 节点名是：home -- 节点值是：湖南 ****结束第3个同学内容**** 解析结束 id 小明 28 19920114 河南 ***************** id 小刚 29 19911114 湖北 ***************** id 小红 28 19920115 湖南 ***************** readXmlByJdom end.

三、总结对比

* dom平台无关，官方解析方式，一次性加载，方便解析，代码容易编写，当文件过大，容易造成内存溢出 * sax基于事件驱动的解析方式，加载时进行验证判断，内存耗费小，不易编码，很难同时访问一个xml中的多处不同数据 * * jdom和dom4j是基于sax扩展 * * jdom仅使用具体类而不使用接口，api中大量使用了collections类 * * dom4j是jdom的一种智能分支，具有性能优异，灵活性好，功能强大和易使用的特点

本文地址：百科问答频道 https://www.neebe.cn/wenda/936629.html，易企推百科一个免费的知识分享平台，本站部分文章来网络分享，本着互联网分享的精神，如有涉及到您的权益，请联系我们删除，谢谢！