面试题：CouchDB中JSON文档的基本特性有哪些

数据结构：
- 层次结构：JSON文档采用树形层次结构，由对象（object）和数组（array）组成。对象是无序的键值对集合，每个键是字符串，值可以是各种数据类型，包括其他对象和数组，这使得数据可以构建复杂的嵌套结构。例如：
```
{
    "name": "John Doe",
    "age": 30,
    "address": {
        "street": "123 Main St",
        "city": "Anytown"
    },
    "hobbies": ["reading", "swimming"]
}
```
- 灵活性：文档结构无需事先定义模式（schema - less），不同的文档可以有不同的结构。例如，一个文档可能有“name”“age”字段，另一个文档可能有“product_name”“price”字段，这在处理多样化的数据时非常方便。
数据类型：
- 基本数据类型：
  - 字符串（string）：用于表示文本，例如“Hello, World!”，遵循UTF - 8编码。
  - 数字（number）：支持整数和浮点数，如10或3.14。
- 复合数据类型：
  - 布尔值（boolean）：有true和false两个值，用于表示逻辑状态。
  - null：表示一个空值或不存在的值。
  - 对象（object）：如上述例子，用于封装相关的数据。
  - 数组（array）：有序的值集合，值可以是任意数据类型，例如[1, "two", true]。

存储方式：CouchDB以JSON文档的形式存储数据，这使得数据存储非常直观。由于无需预定义模式，新的数据字段可以随时添加到文档中，存储具有很大的灵活性。每个文档在CouchDB中都有一个唯一的标识符（_id），并且文档以二进制大对象（BLOB）的形式存储在数据库文件中。
空间利用：文档结构的灵活性可能导致一些空间浪费，因为不同文档可能有不同的字段，无法像关系型数据库那样进行紧凑的存储布局。但另一方面，对于稀疏数据（大部分字段为空的情况），CouchDB的存储方式相对高效，因为它只存储实际存在的字段。

查询方式：
- 视图查询：CouchDB使用视图（views）进行查询。视图是一种将文档映射为键值对集合的函数。由于JSON文档结构的灵活性，在定义视图时可以根据文档中的不同字段进行映射。例如，可以创建一个视图，以文档中的“age”字段作为键，文档本身作为值，这样就可以方便地按年龄范围查询文档。
- MapReduce查询：基于视图的MapReduce机制，可以对JSON文档中的数据进行复杂的聚合操作。例如，计算所有文档中“price”字段的总和。由于JSON文档的数据类型丰富且结构灵活，MapReduce函数可以针对不同的数据类型和结构进行操作。
查询效率：对于简单的按_id查询，CouchDB效率很高，因为它可以直接通过文档的唯一标识符快速定位文档。然而，对于复杂的跨文档查询，由于JSON文档结构的无模式特性，CouchDB可能需要遍历更多的文档来找到符合条件的数据，相比关系型数据库在某些情况下效率可能较低，除非通过精心设计的视图来优化查询。

知识考点