在搜索日期范围聚合索引时获得不同的结果。
创建了如下所示的索引。
curl -XPUT -H 'Content-Type: application/json' 'http://x.x.x.x:9200/date_index' -d '{
"settings" : { "keyspace" : "keyspace1"},
"mappings" : {
"table1" : {
"discover":"sent_date",
"properties" : {
"sent_date" : { "type": "date", "format": "yyyy-MM-dd HH:mm:ssZZ" }
}
}
}
}'
当尝试用下面的代码搜索时,我得到了不同的日期范围结果。
curl -XGET -H 'Content-Type: application/json' 'http://x.x.x.x:9200/date_index/_search?pretty=true' -d '
{
"aggs" : {
"sentdate_range_search" : {
"date_range" : {
"field" : "sent_date",
"time_zone": "UTC",
"format" : "yyyy-MM-dd HH:mm:ssZZ",
"ranges" : [
{ "from" : "2010-05-07 11:22:34+0000", "to" : "2011-05-07 11:22:34+0000"}
]
}
}
}
}'
样本输出,显示2039、2024等不同结果。
{
"took" : 26,
"timed_out" : false,
"_shards" : {
"total" : 3,
"successful" : 3,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : 417427,
"max_score" : 1.0,
"hits" : [
{
"_index" : "date_index",
"_type" : "table1",
"_id" : "P89200822_4210021505784",
"_score" : 1.0,
"_source" : {
"sent_date" : "2039-05-22T14:45:39.000Z"
}
},
{
"_index" : "date_index",
"_type" : "table1",
"_id" : "P89200605_4210020537428",
"_score" : 1.0,
"_source" : {
"sent_date" : "2024-06-05T07:20:57.000Z"
}
},
.........
"aggregations" : {
"sentdate_range_search" : {
"buckets" : [
{
"key" : "2010-05-07 11:22:34+00:00-2011-05-07 11:22:34+00:00",
"from" : 1.273231354E12,
"from_as_string" : "2010-05-07 11:22:34+00:00",
"to" : 1.304767354E12,
"to_as_string" : "2011-05-07 11:22:34+00:00",
"doc_count" : 0
}
]
}
}
仅供参考:我使用的是cassandra数据库中的数据,“发送日期”字段存储在utc时区中。
请告知,谢谢
1条答案
按热度按时间weylhg0b1#
==根据评论中的对话修改答案==
聚合不同于搜索查询。聚合合并记录(即聚合!)沿指定尺寸。问题中的查询将两个指定日期之间的记录聚合到一个存储桶中。有关聚合的更多信息,请参阅elasticsearch文档
由于要求过滤两个日期之间的记录,因此日期范围过滤器是合适的方法:
为什么筛选而不是常规查询?过滤器比搜索更快,因为它们对文档评分没有贡献,而且可以缓存。例如,你可以把过滤和搜索结合起来,得到给定时间范围内所有符合短语“只工作不玩耍,聪明孩子也变傻”的记录