`

网络传输数据解析(SAX)

阅读更多

    来到公司时间已经快有五个月了,虽然在整个公司不算什么老员工,但是在我们Android组已经差不多算是最初的了,呵呵,距离元老级的还差的远啊,不仅是时间,更是技术。
    最近,公司不断扩大Android组,所以又见到了新的面孔,而我们的PM也给我们分配了一个小小的任务,给新人讲解Android知识,不仅是对过去的总结,也是对新人的跟快的直接的知道。我的分配任务其实算最少的,也就是网络解析XML数据,本来我以为是通过不同的方法:DOM/SAX/PULL。但是鉴于实用性所以只是让我们做SAX方面的总结并且做出PPT,模版也给我们了,好了,不扯淡了,现在就开始SAX解析XML的总结。
   
|--所用到的关键字:XML/SAX
    XML:(Extensible Markup Language)即可扩展标记语言,它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用。
    SAX:SAX(simple API for XML)是一种XML解析的替代方法。相比于DOM,SAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOM,SAX 可以在解析文档的任意时刻停止解析,但任何事物都有其相反的一面,对于SAX来说就是操作复杂。
|--对比SAX和DOM解析XML
    |--JAVA 解析 XML 通常有两种方式:DOM 和SAX。DOM(文档对象模型)是W3C标准,提供了标准的解析方式,但其解析效率一直不尽如人意,这是因为DOM解析XML文档时,把所有内容一次性的装载入内存,并构建一个驻留在内存中的树状结构(节点数)。如果需要解析的XML文档过大,或者我们只对该文档中的一部分感兴趣,这样就会引起性能问题。
    |--手机的内存本来就小,考虑性能和充分利用资源的条件下,所以在做手机开发的时候我们一般不用DOM解析。
    |--其实Android已经给我们嵌入了PULL了,我们不需要再添加第三方jar包来支持,我们在以后再说,其实PULL和SAX解析很相似,都是轻量级的解析。
    |--SAX和DOM优缺点比较
        SAX:优点:
        1、逐行扫描文档,一边扫描一边解析
        2、可以在解析文档的任意时刻来停止解析
        SAX:缺点:
        1、操作复杂
        2、添加或删除内容比较麻烦
       
        DOM:优点
        1、全部装载内存,对各个节点的操作灵活
        2、对于节点的添加于删除比较方便灵活
        3、简单,便于操作
        DOM:缺点
        1、消耗内存
        2、需要全部转载到内存才可以解析,如果文件大的话,时间和内存都够呛
|--SAX的工作原理
    SAX,它既是一个接口,也是一个软件包.但作为接口,SAX是事件驱动型XML解析的一个标准接口不会改变 SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
   
    大多数SAX都会产生以下类型的事件:
  1.在文档的开始和结束时触发文档处理事件。
  2.在文档内每一XML元素接受解析的前后触发元素事件。
  3.任何元数据通常由单独的事件处理
  4.在处理文档的DTD或Schema时产生DTD或Schema事件。
  5.产生错误事件用来通知主机应用程序解析错误。
   
    |--SAX解析文档过程举例
        对于一个XML文档举例来说
          <doc>
      <para>Hello,World!</para>
      </doc>
      其解析的过程为:
      1.start document
      2.start element:doc......
      3.start element:para.....
      4.characters:Hello,World!
      5.end element:para......
      6.end element;doc......
      7.end document
    |--对于解析过程中的每一步都会有事件发生,都会触发相应接口中的事件处理程序。
        编写程序的步骤为:
        (1)创建事件处理程序(也就是编写ContentHandler的实现类,一般继承自DefaultHandler类,采用adapter模式)
        (2)创建SAX解析器
        (3)将事件处理程序分配到解析器
        (4)对文档进行解析,将每个事件发送给事件处理程序
    |--SAX 模型
        过程:
      1.首先SAXParserFactory来创建一个SAXParserFactory实例
      SAXParserFactory factory = SAXParserFactory.newInstance();
      2.根据SAXParserFactory实例来创建SAXParser
      3.SAXParser产生SAXReader
      XMLReader reader = factory.newSAXParser().getXMLReader();
      4.XMLReader 加载XML,然后解析XML,在解析的过程中触发相对于接口中的事件处理程序
    |--SAX接口介绍
      |--ContentHandler接口 (主要用到的接口)
          ContentHandler是Java类包中一个特殊的SAX接口,位于 org.xml.sax包中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。
          ContentHandler接口的方法有以下几种:
          void startDocument()
          void endDocument()
          void startElement(String uri, String localName, String qName, Attributes atts)
          void endElement(String uri, String localName, String qName)
          void characters(char[ ] ch, int start, int length)
      |--DTDHandler接口
            DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。
              DTDHandler接口包括以下两个方法
              void startDocumevoid notationDecl(String name, String publicId, String systemId) nt()
              void unparsedEntityDecl(String name, String publicId, String systemId, String notationName)
      |--EntityResolver接口
          EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。
          该接口只有一个方法,如下:
          public InputSource resolveEntity(String publicId, String systemId)
          解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。
      |--ErrorHandler接口
          ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。
          该接口的方法如下:
          void error(SAXParseException exception)
          void fatalError(SAXParseException exception)
          void warning(SAXParseException exception)

分享到:
评论

相关推荐

    Android网络之数据解析----SAX方式解析XML数据

    【正文】 一、XML和Json数据的引入: 通常情况下,每个需要访问网络的应用程序都会有一个自己的服务器,我们可以向服务器提交数据,也可以从服务器获取数据。

    解析XML的三种方式

    它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。在Android下有三种方式解析XML,分别为SAX、DOM、PULL;它们有各自的特点,在网络编程中会经常使用,根据实际情况选择哪一...

    Android程序技术:个人学习助手项目习题详情显示.pptx

    在实际开发中,由于不同操作系统存储数据的格式不兼容,当这些系统在进行数据传输时,会变得很困难。 为此,W3C组织推出了一种新的数据交换标准—XML,它是一种通用的数据交换格式, 易于保存树状结构的数据,可以使...

    JOX实现XML和JavaBean相互转化

    许多时候需要用到XML来传输数据,实现了将XML转化为JAVA对象,而JAVA具有很容易操作的特点,从而成功绕过了XML解析问题。比如:在WebService有时需要传送JAVA对象,当定义相应的WSDL文件却较为麻烦,通过JOX可以将...

    android解析xml文件的方式

    在androd手机中处理xml数据时很常见的事情,通常在不同平台传输数据的时候,我们就可能使用xml,xml是与平台无关的特性,被广泛运用于数据通信中,那么在android中如何解析xml文件数据呢?通常有三种方式:DOM,SAX,...

    Python XML 解析

    XML 被设计用来传输和存储数据。 XML 是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。 它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言...

    深入Java Servlet网络编程

    目录 第1章 分布式Web应用程序 ...附录A 超文本传输协议 A. 1 MIME A. 2 URI和URL A. 3 HTTP详解 A. 3. 1 建立TCP/IP连接 A. 3. 2 客户端发送请求 A. 3. 3 服务器返回响应 A. 3. 4 HTTP报头 附录B Servlet API

    Android环境下Ksoap连接Axis2

    在Android环境下使用Ksoap连接Axis2,传输的参数为自定义类对象,数据格式为XML,使用Sax解析XML报文

    疯狂XML讲义(Web Service).pdf

    第三部分介绍了DOM、SAX、JAXP、dom4j、JDOM、XQuery和XQJ等,其中的DOM、SAX、JAXP、dom4j和JDOM都以结构化的方式来创建、解析XML文档,从而可以将XML文档作为数据传输工具,而XQuery则是一种新规范,通过XQuery...

    疯狂XML讲义

    第三部分介绍了DOM、SAX、JAXP、dom4j、JDOM、XQuery和XQJ等,其中的DOM、SAX、JAXP、dom4j和JDOM都以结构化的方式来创建、解析XML文档,从而可以将XML文档作为数据传输工具,而XQuery则是一种新规范,通过XQuery...

    Python如何对XML 解析

    XML 被设计用来传输和存储数据。 XML 是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。 它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言...

    xml入门经典-part3(中文版)

    8.5.6 如何传输片段 8.5.7 小结 8.6 查询 8.6.1 什么是查询语言 8.6.2 关系型数据库和XML文档之间的区别 8.6.3 XML查询语言的发展历史 8.6.4 使用Xpath和XSLT查询XML文档 8.6.5 查询语言展望 8.7 小结 第9...

    JAVA_API1.6文档(中文)

    java.awt.datatransfer 提供在应用程序之间和在应用程序内部传输数据的接口和类。 java.awt.dnd Drag 和 Drop 是一种直接操作动作,在许多图形用户界面系统中都会遇到它,它提供了一种机制,能够在两个与 GUI 中...

    疯狂xml讲义

    第三部分介绍了DOM、SAX、JAXP、dom4j、JDOM、XQuery和XQJ等,其中的DOM、SAX、JAXP、dom4j和JDOM都以结构化的方式来创建、解析XML文档,从而可以将XML文档作为数据传输工具,而XQuery则是一种新规范,通过XQuery...

    疯狂XML讲义.part3.rar

    第三部分介绍了DOM、SAX、JAXP、dom4j、JDOM、XQuery和XQJ等,其中的DOM、SAX、JAXP、dom4j和JDOM都以结构化的方式来创建、解析XML文档,从而可以将XML文档作为数据传输工具,而XQuery则是一种新规范,通过XQuery...

    疯狂XML讲义.part1

    第三部分介绍了DOM、SAX、JAXP、dom4j、JDOM、XQuery和XQJ等,其中的DOM、SAX、JAXP、dom4j和JDOM都以结构化的方式来创建、解析XML文档,从而可以将XML文档作为数据传输工具,而XQuery则是一种新规范,通过XQuery...

    疯狂XML讲义.part2.rar

    第三部分介绍了DOM、SAX、JAXP、dom4j、JDOM、XQuery和XQJ等,其中的DOM、SAX、JAXP、dom4j和JDOM都以结构化的方式来创建、解析XML文档,从而可以将XML文档作为数据传输工具,而XQuery则是一种新规范,通过XQuery...

    stream-csv-as-json:节点流组件的微库,具有最小的依赖关系,可用于创建面向处理大型CSV文件的自定义数据处理器,同时所需的内存占用最少

    甚至单个原始数据项也可以分段流式传输。 还包括流式 SAX 启发的基于事件的 API。 stream-csv-as-json是的配套项目,旨在与其过滤器、流和通用基础设施一起使用。 可用组件: 流式 JSON。 它产生一个类似于 SAX...

    用Python解析XML的几种常见方法的介绍

     XML(eXtensible Markup Language)指可扩展标记语言,被设计用来传输和存储数据,已经日趋成为当前许多新生技术的核心,在不同的领域都有着不同的应用。它是web发展到一定阶段的必然产物,既具有SGML的核心特征,...

Global site tag (gtag.js) - Google Analytics