博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ElasticSearch 6.x 父子文档[join]分析
阅读量:5240 次
发布时间:2019-06-14

本文共 2539 字,大约阅读时间需要 8 分钟。

ES6.0以后,索引的type只能有一个,使得父子结构变的不那么清晰,毕竟对于java开发者来说,index->db,type->table的结构比较容易理解。

按照官方的说明,之前一个索引有多个type,如果有一个相同的字段在不同的type中出现,在ES底层其实是按照一个field来做lucene索引的,这很具有迷惑性,容易造成误解。所以6.0以后,所有的字段都在索引的_doc【默认type】中集中定义。假设索引中会有parent和child两个类型的文档,那么可能parent引用了abcd字段,child引用了aef字段,各取所需。

目前我用的es版本为6.3,父子结构需要用join字段来定义,关系的映射用relations字段来指定。

一个索引中只能有一个join类型字段,如果定义一个以上的join字段,会报错:Field [_parent_join] is defined twice in [_doc]

join字段中的relations集合,建好索引之后,可以增加映射,或者给原有的映射添加child,但是不能删除原有的映射。
比如,原有的relations定义为:

"myJoin": {  "type": "join",  "eager_global_ordinals": true,  "relations": {    "parent_a": child_a1  }}

现在通过updateMapping API增加一条映射parent_b,原有的映射增加了child_a2child_a3

"myJoin": {  "type": "join",  "eager_global_ordinals": true,  "relations": {    "parent_a": [      "child_a1",      "child_a2",      "child_a3"    ],    "parent_b": "child_b"  }}

 中午睡了个午觉,接着再写一点join的操作

  • 根据子文档查询父文档
GET /test_index_join/_search{  "query": {    "has_child": {      "type": "child_a1",      "score_mode": "max",       # 基于child_a1文档定义来搜索,query里的查询字段是child_a1里的      "query": {        "term": {          "salesCount": 100        }      }    }  }}
  • 根据子文档对父文档进行排序

说明:根据子文档的字段影响父文档的的得分,然后父文档根据_score来排序。

下面例子中,父文档的得分为:_score * child_a1.salesCount,score_mode可以是min,max,sum,avg,first等。

GET /test_index_join/_search{  "query": {    "has_child": {      "type": "child_a1",      "score_mode": "max",       "query": {        "function_score": {          "script_score": {            "script": "_score * doc['salesCount'].value"          }        }      }    }  },  "sort": [    {      "_score": {        "order": "asc"      }    }  ]}

 还可以依赖field_value_factor来影响父文档得分,效果相似,效率更高;functions支持多个field影响因子,多个因子的默认[score_mode]计分模式为multiply[相乘],还有其他可选模式为:min,max,avg,sum,first,multiply。

下面例子中,父文档的得分为:salesCount,因为没有其他的影响因子,如果有多个,则取最大的一个,因为score_mode为max。

GET /test_index_join/_search{  "query": {    "has_child": {      "type": "child_a1",      "score_mode": "max",       "query": {        "function_score": {          "functions": [            {              "field_value_factor": {                "field": "salesCount"              }            }          ]        }      }    }  },  "sort": [    {      "_score": {        "order": "asc"      }    }  ]}

 

  • 根据父文档查询子文档
GET /test_index_join/_search{  "query": {    "has_parent": {      "parent_type": "parnet_a",      # 基于parnet_a来搜索,query里的查询字段是parnet_a里的      "query": {        "range": {          "price": {            "gt": 1,            "lte": 200          }        }      }    }  }}

 

转载于:https://www.cnblogs.com/yucy/p/9504939.html

你可能感兴趣的文章
欢迎来的我的前端技术博客
查看>>
DB2同平台迁移数据库
查看>>
sql编程
查看>>
kubernetes实战(四):k8s持久化安装rabbitmq集群
查看>>
SQL优化SQL tuning
查看>>
微信小程序——获取openid
查看>>
数据导入导出、备份恢复
查看>>
毕业设计10-21星期六
查看>>
$.ajax
查看>>
Redhat PXE服务器配置-待验证
查看>>
Java Exception 和Error
查看>>
python库学习笔记(re库)
查看>>
Spring多数据源的配置和使用
查看>>
算法总结之 删除链表的中间节点和a/b处的节点(链表中间节点的重要思想)
查看>>
1.类的两种创建方式(通过元类创建类)
查看>>
使用promisify来流程化异步操作
查看>>
采用CAS原理构建单点登录
查看>>
docker 安装完mysql 后客户端无法访问
查看>>
CentOS7 mono环境连接WCF
查看>>
[转]关于GCD与多线程
查看>>