如何使用过滤器脚本在elasticsearch中迭代嵌套数组?

5lwkijsr  于 2021-06-14  发布在  ElasticSearch
关注(0)|答案(2)|浏览(244)

我正在尝试筛选elasticsearch中的嵌套字段。嗯,我需要根据特定的规则归还某些文件。要重现我得到的错误,可以通过以下示例进行指导:

PUT my-index-000001
{
  "mappings": {
    "properties": {
      "user": {
        "type": "nested" 
      }
    }
  }
}
PUT my-index-000001/_doc/1
{
  "group": "fans",
  "user": [
    {
      "first": "John",
      "last": "Smith"
    },
    {
      "first": "Alice",
      "last": "White"
    }
  ]
}

可以看到,我们有一个对象数组(嵌套的)。
我需要在嵌套字段上应用一个脚本,在这里我可以遍历用户数组。
例如,我尝试了以下方法:

GET my-index-000001/_search
{
  "query": {
    "nested": {
      "path": "user",
      "query": {
        "bool": {
          "filter": [
            {
              "script": {
                "script": {
                  "inline": """
                  def users = doc['user'];
                  for ( int i = 0; i < users.size(); i++ ) {

                  }
                  return true;
                  """
                }
              }
            }
          ]
        }
      }
    }
  }
}

我得到这个错误

{
  ...
          "script_stack" : [
            "org.elasticsearch.search.lookup.LeafDocLookup.get(LeafDocLookup.java:90)",
            "org.elasticsearch.search.lookup.LeafDocLookup.get(LeafDocLookup.java:41)",
            "users = doc['user'];\n                  ",
            "            ^---- HERE"
          ],
          ...
          "caused_by" : {
            "type" : "illegal_argument_exception",
            "reason" : "No field found for [user] in mapping with types []"
          }
        }
      }
    ]
  },
  "hits" : {
    "total" : {
      "value" : 0,
      "relation" : "eq"
    },
    "max_score" : null,
    "hits" : [ ]
  }
}

elasticsearch 7.7版
这有可能吗?我已经复习了一些答案,但我不太清楚。

du7egjpx

du7egjpx1#

嵌套文档非常强大,因为您保留了某些属性连接,但也有一个缺点,就是不能像这里所讨论的那样对它们进行迭代。
说了这话你就可以把 users 属性使用 copy_to 这样的特点:

PUT my-index-000001
{
  "mappings": {
    "properties": {
      "user__first_flattened": {
        "type": "keyword"
      },
      "user": {
        "type": "nested",
        "properties": {
          "first": {
            "type": "keyword",
            "copy_to": "user__first_flattened"
          }
        }
      }
    }
  }
}

然后

PUT my-index-000001/_doc/1
{
  "group": "fans",
  "user": [
    {
      "first": "John",
      "last": "Smith"
    },
    {
      "first": "Alice",
      "last": "White"
    }
  ]
}

现在您可以访问字段值并可以对其进行迭代(如果需要,还可以使用循环索引来帮助定位/标识正确的“嵌套”子文档。)这只适用于在每个嵌套子文档中表示的字段上进行迭代以使循环不会被截断的假设:

GET my-index-000001/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "script": {
            "script": {
              "inline": """
                  def users = doc.user__first_flattened;
                  // users == [Alice, John]
                  for ( int i = 0; i < users.size(); i++ ) {

                  }
                  return true;
                  """
            }
          }
        }
      ]
    }
  }
}

请注意,我们没有进行 nested 查询b/c我们在这个上下文之外,在根目录中得到了我们的扁平字段。
同样值得一提的是,你可以取代 copy_toinclude_in_root 这在这里同样有用。

vawmfj5a

vawmfj5a2#

给定父文档的嵌套文档列表在嵌套上下文中不可用。因此,“doc['user']”在脚本中为您提供了异常。但是,可以按以下方式访问单个嵌套文档:

GET my-index-000001/_search
{
  "query": {
    "nested": {
      "path": "user",
      "query": {
        "script": {
          "script": "doc['user.first.keyword']=='John'" // <==== This can be done.
        }
      }
    }
  }
}

相关问题