elasticsearch嵌套排序-用于排序的文档和嵌套对象之间不匹配

9rygscc1  于 2021-07-09  发布在  Java
关注(0)|答案(1)|浏览(447)

我一直在开发一个新的搜索api,以aws elasticsearch(版本6.2)为后端。
现在,我正在尝试支持api的“排序”选项。
我的Map如下(不包括不相关的字段):

{
  "properties": {
    "id": {
      "type": "text",
      "fields": {
        "raw": {
          "type":  "keyword"
        }
      }
    },
    "description": {
      "type": "text"
    },
    "materialDefinitionProperties": {
      "type": "nested",
      "properties": {
        "id": {
          "type": "text",
          "fields": {
            "raw": {
              "type":  "keyword"
            }
          },
          "analyzer": "case_sensitive_analyzer"
        },
        "value" : {
          "type": "nested",
          "properties": {
            "valueString": {
              "type": "text",
              "fields": {
                "raw": {
                  "type":  "keyword"
                }
              }
            }
          }
        }
      }
    }
  }
}

我正在尝试允许用户按属性值排序(路径: materialDefinitionProperties.value.valueLong.raw ).
请注意,它位于嵌套对象的两个级别内(materialdefinitionproperties和materialdefinitionproperties.value是嵌套对象)。
要按id为“part number”的属性值对结果进行排序,我的排序请求是:

{
    "fieldName": "materialDefinitionProperties.value.valueString.raw",
    "nestedSort": {
        "path": "materialDefinitionProperties",
        "filter": {
            "fieldName": "materialDefinitionProperties.id",
            "value": "PART NUMBER",
            "slop": 0,
            "boost": 1
        },
        "nestedSort": {
            "path": "materialDefinitionProperties.value"
        }
    },
    "order": "ASC"
}

但是,当我检查响应时,“sort”字段与文档的属性值不匹配:

{
    "_index": "material-definition-index-v2",
    "_type": "default",
    "_id": "development_LITL4ZCNE",
    "_source": {
        "id": "LITL4ZCNE",
        "description": [
            "CPU, Intel, Cascade Lake, 8259CL, 24C, 210W, B1 Prod"
        ]
        "materialDefinitionProperties": [
            {
                "id": "PART NUMBER",
                "description": [],
                "value": [
                    {
                        "valueString": "202-001193-001",
                        "isOriginal": true
                    }
                ]
            }
        ]
    },
    "sort": [
        "100-000018"
    ]
},

文档的part number属性是“202-001193-001”,“sort”字段表示“100-000018”,这是另一个文档的part number。
主文档和用于排序的嵌套对象之间似乎不匹配。
当集群中只有少量文档时,这个请求工作得很好。但一旦我用大约100万条记录回填集群,症状就会出现。我也尝试过创建一个新的es集群,但是结果是一样的。
按其他非嵌套属性排序效果很好。
我是否误解了嵌套对象的概念,或者误用了嵌套排序功能?
有什么好主意,谢谢!

eit6fx6z

eit6fx6z1#

这是elasticsearch中的一个bug。升级到6.4.0修复了这个问题。
问题跟踪程序:https://github.com/elastic/elasticsearch/pull/32204
发行说明:https://www.elastic.co/guide/en/elasticsearch/reference/current/release-notes-6.4.0.html

相关问题