面试题：ElasticSearch聚合查询中常见错误类型及处理方法

出现场景：
- 聚合语句结构写得不正确，比如在 terms 聚合中遗漏必要参数。例如，{"aggs": {"my_terms": {"terms": }}}，这里 terms 聚合缺少 field 字段。
- 使用了不支持的语法。例如，在 date_histogram 聚合中使用了错误的时间间隔关键字。正确的如 {"aggs": {"my_date_hist": {"date_histogram": {"field": "timestamp", "interval": "day"}}}}，若写成 {"aggs": {"my_date_hist": {"date_histogram": {"field": "timestamp", "interval": "daily"}}}}，“daily” 不是支持的间隔关键字就会报错。
处理方法：
- 仔细检查聚合语句结构，参照 ElasticSearch 官方文档中对应聚合类型的语法格式进行编写。例如，terms 聚合必须要有 field 字段指定要聚合的字段。
- 确认使用的关键字等语法元素是 ElasticSearch 支持的，多参考官方文档的示例和说明。

出现场景：
- 对非聚合支持类型的字段进行聚合。例如，对一个 text 类型且未设置 fielddata 的字段进行 terms 聚合。text 类型默认不支持直接聚合，因为它会进行分词处理。若字段映射为 {"my_text_field": {"type": "text"}}，直接 {"aggs": {"my_terms": {"terms": {"field": "my_text_field"}}}} 就会报错。
- 聚合字段的类型与预期不符。比如原本期望一个 date 类型字段用于 date_histogram 聚合，但实际字段映射为 keyword 类型。若字段映射为 {"my_date_field": {"type": "keyword"}}，执行 {"aggs": {"my_date_hist": {"date_histogram": {"field": "my_date_field", "interval": "day"}}}} 就会出错。
处理方法：
- 对于 text 类型字段，如果要进行 terms 聚合等操作，可设置 fielddata: true 来启用聚合（但要注意内存开销），修改字段映射为 {"my_text_field": {"type": "text", "fielddata": true}}，或者将字段类型改为 keyword 类型（适用于不需要分词的场景）。
- 确保聚合字段的类型符合聚合要求。若类型错误，可通过重新映射字段来修正，例如将 keyword 类型字段重新映射为 date 类型，但要注意这可能涉及数据迁移等操作。

出现场景：
- 聚合字段的值为空或缺失。例如，在进行 sum 聚合时，聚合字段在某些文档中没有值。假设有文档 {"my_number_field": null}，执行 {"aggs": {"my_sum": {"sum": {"field": "my_number_field"}}}}，可能会得到不准确的结果或者报错。
- 数据集中没有满足聚合条件的文档。比如在 filter 聚合后再进行其他聚合，若 filter 条件太严格，没有文档匹配，后续聚合可能得到空结果。例如 {"aggs": {"my_filter": {"filter": {"term": {"status": "completed"}}, "aggs": {"my_count": {"value_count": {"field": "id"}}}}}}，若没有 status 为 completed 的文档，my_count 聚合结果为空。
处理方法：
- 对于聚合字段值缺失的情况，可以在聚合时使用 missing 参数指定缺失值的处理方式。例如，{"aggs": {"my_sum": {"sum": {"field": "my_number_field", "missing": 0}}}}，这样缺失值会被当作 0 来处理。
- 检查 filter 等条件是否合理，确保有文档能满足聚合前置条件。可以适当放宽条件或者检查数据是否录入正确。

出现场景：
- 聚合粒度太细导致内存溢出。例如，在大数据量下对一个高基数（大量不同值）字段进行 terms 聚合，且没有设置 size 参数限制桶的数量。如 {"aggs": {"my_terms": {"terms": {"field": "user_id"}}}}，如果 user_id 有非常多不同的值，可能会耗尽内存。
- 嵌套聚合过深。比如多层嵌套 terms 聚合，每一层聚合都会增加计算复杂度和内存消耗。例如 {"aggs": {"outer_terms": {"terms": {"field": "category"}, "aggs": {"inner_terms": {"terms": {"field": "sub_category"}, "aggs": {"inner_inner_terms": {"terms": {"field": "product_name"}}}}}}}，过深的嵌套可能导致性能问题甚至查询失败。
处理方法：
- 对于高基数字段的 terms 聚合，设置合理的 size 参数限制桶的数量，例如 {"aggs": {"my_terms": {"terms": {"field": "user_id", "size": 100}}}}，只获取前 100 个最频繁的桶。也可以考虑使用 composite 聚合来分页获取桶数据。
- 避免不必要的嵌套聚合，尽量简化聚合结构。如果确实需要多层嵌套，评估每层聚合的必要性，对可以合并的聚合进行合并处理。

知识考点