目录
Query Context && Filter Context
条件组合
bool查询
语法
利用bool查询解决结构化查询---包含而不是相等的条件(问题可以点击这里查看)
bool支持嵌套
查询语句的结构会对相关度算分产生影响
控制字段的Bootsting
本节知识点回顾
Query Context && Filter Context
- 高级搜索的功能:支持多项文本输入,针对多个字段进行搜索
- 搜索引擎一般也提供基于时间,价格等条件的过滤
- 在ES中,有Query 和Filter 两种不同的Context
- Query Context:相关性算分
- Filter Context:不需要算分(Yes or No),可以利用Cache,获得更好的性能
条件组合
- 假设要一个搜索包含了三段逻辑,针对不同的字段
- 评论字段包含Guitar/用户评分大于3/上映日期需要在给定范围
- 同时包含这三个逻辑.并且有比较好的性能
- 复合查询: bool Query
bool查询
- 一个bool查询,是一个或者多个查询子句的组合
- 总共包括4种字句:其中2种会影响算分,2种不影响算分
- 相关性并不只是全文本检索的专利,也适用于yes|no的子句,匹配的子句越多,相关性评分越高,如果多条查询子句被合并为一条复合查询语句,比如Bool查询,则每个查询子句计算得出的评分会被合并到总的相关性评分中
must | 必须匹配,贡献得分 |
should | 选择性匹配,贡献得分 |
must_not | Filter Context 查询子句,必须不能匹配 |
filter | Filter Context 必须匹配,但是不贡献算分 |
语法
- 子查询可以任意顺序出现
- 可以嵌套多个查询
- 如果你的bool查询中,没有must条件,should中必须满足一条查询
POST products/_search
{
"query": {
"bool": {
"must":
{
"term": {
"price": {
"value": 30
}
}
},
"filter":
{
"term": {
"avaliable": false
}
},
"must_not": [
{
"range": {
"price":{
"gt": 30
}
}
}
],
"should": [
{
"term": {
"productID.keyword": {
"value": "ASDF-A-1293-#fJ3"
}
}
},
{
"term": {
"productID.keyword": {
"value": "QWER-A-1293-#fJ3"
}
}
}
],
"minimum_should_match": 1
}
}
}
利用bool查询解决结构化查询---包含而不是相等的条件
- 增加一个genre count字段进行计数
bool支持嵌套
查询语句的结构会对相关度算分产生影响
- 同一层级下的竞争字段,具有相同的权重
- 通过嵌套bool查询,可以改变对算分的影响
控制字段的Bootsting
- Boosting是控制相关度的一种手段
- 索引,字段或者查询子条件
- 参数boost的含义
- 当boost >1 时,打分的相关度相对提升
- 当0<boost <1 时,打分的权重相对性降低
- 当boost < 0 时,共享负分
- 要求苹果公司的产品优先
当 content包含apple会打一个positive的分,content包含pie会打一个negative的分:提升了presion和recall
POST /news/_search
{
"query": {
"boosting": {
"positive": {
"match": {
"content": "apple"
}
},
"negative": {
"match": {
"content": "pie"
}
},
"negative_boost": 0.5
}
}
}
本节知识点回顾
- Query Context VS Filter Context
- Bool Query -更多的条件组合
- 查询结构与相关性算分
- 如何控制查询的精确度
- Boosting && Boosting Query