HTTP

HTTP 知识量:10 - 42 - 186

10.4 数据发布的格式及语言><

可扩展标记语言- 10.4.1 -

XML(eXtensible Markup Language,可扩展标记语言)是一种可按应用目标进行扩展的通用标记语言。旨在通过使用XML,使互联网数据共享变得更容易。

XML和HTML都是从标准通用标记语言SGML(Standard Generalized Markup Language)简化而成。与HTML相比,它对数据的记录方式做了特殊处理。

XML和HTML一样,使用标签构成树形结构,并且可自定义扩展标签。下面是一个示例:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<?xml-stylesheet type="text/xsl" href="student.xsl"?>
<!-- 学生名单 -->
<student_list>
    <student>
        <number>20220101</number>
        <name>Bob</name>
        <class>1-1</class>
    </student>
    <student>
        <number>20220102</number>
        <name>Jeff</name>
        <class>1-2</class>
    </student>
</student_list>

从XML文档中读取数据比起HTML更为简单。由于XML的结构基本上都是用标签分割而成的树形结构,因此通过语法分析器(Parser)的解析功能解析XML结构并取出数据元素,可更容易地对数据进行读取。

RSS/Atom- 10.4.2 -

RSS(简易信息聚合,也叫聚合内容)和Atom都是发布新闻或博客日志等更新信息文档的格式的总称。两者都用到了XML。

JSON- 10.4.3 -

JSON(JavaScript Object Notation)是一种以JavaScript(ECMAScript)的对象表示法为基础的轻量级数据标记语言。能够处理的数据类型有false、null、true、对象、数组、数字、字符串等7种类型。示例如下:

{
    "title": "story",
    "content": "This is a good story."
}

JSON让数据更轻更纯粹,并且JSON的字符串形式可被JavaScript轻易地读入。当初配合XML使用的Ajax技术也让JSON的应用变得更为广泛。另外,其他各种编程语言也提供丰富的库类,以达到轻便操作JSON的目的。