查询
#查询所有索引和详情信息
#此方法查询的显示更加详细的索引信息显示
GET /_cat/indices?v
GET /_cat/indices
#查询某个索引
GET person
#查询全部索引的状态数据
GET /_cat/indices?v
#查询
GET http://ip:端口/索引名称 # 查询单个索引信息
GET http://ip:端口/索引名称1,索引名称2... # 查询多个索引信息
GET http://ip:端口/_all # 查询所有索引信息
#查询索引user映射
GET user/_mapping
#查询user索引文档,指定id
GET /user/_doc/1
#查询user索引所有文档
GET /user/_search
添加
#添加
PUT http://ip:端口/索引名称
#添加索引
PUT user
#创建索引并添加映射(推荐)
PUT /person1
{
"mappings": {
"properties": {
"name": {
"type": "text"
},
"age": {
"type": "integer"
}
}
}
}
#添加字段(属性)
PUT /person1/_mapping
{
"properties": {
"name": {
"type": "text"
},
"age": {
"type": "integer"
},
"createTime": {
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
}
}
}
##如果需要用时间范围查询,必须要设置"type": "date"和"format"
#请注意,在设置日期映射时,建议使用Elasticsearch支持的日期格式,并根据需要选择正确的日期格式。此外,如果您已经创建了索引并且需要更新日期映射,可以使用Update Mapping API来更新。
#添加文档,指定id
POST /person/_doc/1
{
"name":"张三",
"age":18,
"address":"北京"
}
#添加文档,不指定id
POST /person1/_doc/
{
"name":"张三",
"age":18,
"address":"北京"
}
#字段"tel"不可以进行查询,不然会报错只因创建映射时"tel"的"index"为false
{
"user": {
"mappings": {
"properties": {
"name": {
"type": "text"
},
"sex": {
"type": "keyword"
},
"tel": {
"type": "keyword",
"index": false
}
}
}
}
}
#实现模糊检索,类似于SQL中的like条件,这个需求我们使用wildcard类型字段来实现.
对同一个字段即可实现模糊检索,也能实现分词检索(我们原来使用text类型字段+ik分词器实现),这两种检索应用于同一字段
定义字段 name:【使用示例,就是在已经固定的mapping映射上加属性,因为已经添加的属性不能修改,只能添加】
"name": {
"type": "text",
"fields": {
"wildcard": {
"type": "wildcard"
},
"ik": {
"type": "text",
"analyzer": "ik_max_word"
}
}
}
#然后进行检索如下,可以同时对 name.wildcard 和 name.ik 字段进行检索
{
"query": {
"multi_match": {
"query": "查询关键词",
"fields": ["name.wildcard", "name.ik"]
}
}
}
修改
#局部更新
POST /user/_update/4
{
"doc": {
"email":"88886"
}
}
#全量更新,存在就更新,不存在就创建
POST /user/_doc/4
{
"name" : "王九",
"sex" : "男性",
"tel" : "99"
}
删除
#删除索引
DELETE /索引名称
#例如删除索引dev
DELETE /dev
#删除指定id文档
DELETE /person/_doc/1
#删除某个文档中的属性
POST user/_doc/1/_update
{
"script" : "ctx._source.remove('new_field')"
}
# 按照查询条件进行删除
POST user/_delete_by_query
{
"query":{
"match_phrase":{
"catagoryId": "1643191714195750913"
}
}
}
高级ur路径查询
#查询name端包含王或者九的
GET /user/_search?q=name:王九
#URL带参数形式查询,这很容易让不善者心怀恶意,或者参数值出现中文会出现乱码情况。为了避免这些情况,我们可用使用带JSON请求体请求进行查询
高级查询term
#term是代表完全匹配,也就是精确查询,搜索前不会再对搜索词进行分词拆解
GET user/_search
{
"query": {
"term": {
"FIELD": {
"value": "VALUE"
}
}
}
}
#terms里的[ ] 多个是或者的关系,只要满足其中一个词就可以
GET user/_search
{
"query": {
"terms": {
"FIELD": [
"VALUE1",
"VALUE2"
]
}
}
}
#terms里的[ ] 多个是或者的关系,只要满足其中一个词就可以。想要通知满足两个词的话,就得使用bool的must来做
GET user/_search
{
"query": {
"bool": {
"must": [
{"term": {
"FIELD": {
"value": "VALUE"
}
}},
{
"term": {
"FIELD": {
"value": "VALUE"
}
}
}
]
}
}
}
高级查询match
#查找所有文档内容
GET user/_search
{
"query":{
"match_all":{}
}
}
# 查询全部文档指定字段
GET user/_search
{
"query":{
"match_all":{}
},
"_source":["FIELD"]
}
#match进行搜索的时候,会先进行分词拆分,拆完后,再来匹配
GET user/_search
{
"query": {
"match": {
"FIELD": "TEXT"
}
}
}
#match_phrase 称为短语搜索,要求所有的分词必须同时出现在文档中,同时位置必须紧邻一致
GET user/_search
{
"query": {
"match_phrase": {
"FIELD": "PHRASE"
}
}
# 上面的 MatchQuery 有一个短板,假如用户输入了某关键字,我们在查找的时候并不知道他输入的是 name 还是 description,这时我们用什么都不合适,而 MultiQuery 的出现解决了这个问题,他可以通过 fields 属性来设置多个域联合查找
GET user/_search
{
"query": {
"multi_match": {
"query": "Spring开发",
"minimum_should_match": "70%",
"fields": ["name", "description"]
}
}
}
}
# 在多域联合查询的时候,可以通过 boost 来设置某个域在计算得分时候的比重,比重越高的域当他符合条件时计算的得分越高,相应的该记录也更靠前。通过在 fields 中给相应的字段用 ^权重倍数来实现
GET user/_search
{
"query": {
"multi_match": {
"query": "Spring开发",
"minimum_should_match": "70%",
"fields": ["name^10", "description"]
}
}
}
}
多条件查询,must相当于数据库的&&,should相当于数据库的||
#must相当于数据库的&&
GET user/_search
{
"query":{
"bool":{
"must":[{
"match":{
"name":"小王"
}
},{
"match":{
"age":18
}
}]
}
}
}
#should相当于数据库的||
GET user/_search
{
"query":{
"bool":{
"should":[{
"match":{
"name":"小王"
}
},{
"match":{
"age":18
}
}]
}
}
}
如果我们既要对一些字段进行分词查询,同时要对另一些字段进行精确查询,就需要使用布尔查询来实现了。布尔查询对应于Lucene的BooleanQuery查询,实现将多个查询组合起来,有三个可选的参数:must:文档必须匹配must所包括的查询条件,相当于 “AND”should:文档应该匹配should所包括的查询条件其中的一个或多个,相当于 "OR"must_not:文档不能匹配must_not所包括的该查询条件,相当于“NOT”
GET user/_search
{
"query": {
"bool": { // 布尔查询
"must": [ // 查询条件 must 表示数组中的查询方式所规定的条件都必须满足
{
"multi_match": {
"query": "王小妹",
"minimum_should_match": "50%",
"fields": [
"name^10",
"title"
]
}
},
{
"term": {
"address": "广州"
}
}
]
}
}
}
分页查询
GET user/_search
{
"query":{
"match_all":{}
},
"from":0,
"size":2
}
查询排序,支持对 keyword、date、float 等类型添加排序,text类型的字段不允许排序,text因为会分词,所以排序不了
{
"query":{
"match_all":{}
},
"sort": [
{
"age": {
"order": "desc"
}
}
]
}
范围查询
GET user/_search
{
"query":{
"bool":{
"should":[{
"match":{
"name":"小王"
}
},{
"match":{
"age":18
}
}],
"filter": [
{"range": {
"age": {
"gte": 10,
"lte": 20
}
}}
]
}
}
}
全文检索
{
"query":{
"match":{
"name" : "王妹"
}
}
}
高亮查询,高亮展示的数据,本身就是文档中的一个field,单独将field以highlight的形式返回给你。
ES提供了一个highlight属性,和query同级别的
GET user/_search
{
"query": {
"match_phrase": {
"name": "张三"
}
},
"highlight": {
"fields": {
"name": {}
},
"pre_tags": "<font color='red'>",
"post_tags": "</font>",
"fragment_size": 10
}
}
}
#全文高亮检索
GET person1/_search
{
"query": {
"multi_match": {
"query": "广州",
"fields": []
}
},
"highlight": {
"fields": {
"*": {}
}
}
}
fragment_size :指定高亮数据展示多少个字符回来;
pre_tag:指定前缀标签,如 < font color=“red”>
post_tags:指定后缀标签,如 < /font>
field:指定那个字段为高亮字段
定义过滤器查询,是在原本查询结果的基础上对数据进行筛选,因此省略了重新计算的分的步骤,效率更高。并且方便缓存。推荐尽量使用过虑器去实现查询或者过虑器和查询共同使用,过滤器在布尔查询中使用,过滤查询和检索查询能做一样的效果。区别在于过滤查询不评分,结果能缓存,检索查询要评分,结果不缓存。 一般是不会直接使用过滤查询,都是在检索了一定数据的基础上再使用,下边是在搜索结果的基础上进行过滤
GET user/_search
{
"query": {
"bool": {
"must": [
{
"multi_match": {
"query": "王小妹",
"minimum_should_match": "50%",
"fields": [
"name^10",
"title"
]
}
}
],
"filter": [
{
// 过滤条件:studymodel 必须是 201001
"match": {"address": "广州"}
},
{
// 过滤条件:年龄 >=10 <=100
"range": {"age": {"gte": 10,"lte": 100}}
}
]
}
}
}
分组查询
GET user/_search
{
"aggs": {
"gg_gl": {
"terms": {
"field": "age"
}
}
},
"size": 0
}
高级映射嵌套**【字段type设置为keyword就不会被分词】
#嵌套节点下面新增字段
PUT /user/_mapping
{
"properties": {
"school": {
"type": "keyword",
"norms": false,
"doc_values": false
},
"teacher": {
"type": "nested",
"properties": {
"rightStatus": {
"type": "keyword",
"norms": false,
"doc_values": false
},
"rightCurrTime": {
"type": "keyword",
"norms": false,
"doc_values": false
}
}
}
}
}
#关闭、打开索引(关闭索引是为了释放内存,将数据持久化到硬盘,不可读写已经关闭的索引)
POST http://ip:端口/索引名称/_close
POST http://ip:端口/索引名称/_open ```
IK分词器有两种分词模式:ik_max_word和ik_smart模式
linux系统安装分词器,首先docker安装es
进入到es
docker exec -it elasticsearch /bin/bash
执行安装ik分词器(注意安装的分词器需要与es版本一直,不一致更改一下ik分词器的版本号)
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.0/elasticsearch-analysis-ik-7.12.0.zip
安装成功后,可以再宿主机es挂卷的plugin下看到ik文件,然后必定要重启es容器
docker restart elasticsearch
在kibana上操作,查看分词器结果**【注意如是是英文字母大写,使用默认分词器分词后都会变成小写】
GET /_analyze
{
"analyzer": "ik_smart",
"text": "东哥是前端大佬"
}
#结果
{
"tokens" : [
{
"token" : "东",
"start_offset" : 0,
"end_offset" : 1,
"type" : "CN_CHAR",
"position" : 0
},
{
"token" : "哥",
"start_offset" : 1,
"end_offset" : 2,
"type" : "CN_CHAR",
"position" : 1
},
{
"token" : "是",
"start_offset" : 2,
"end_offset" : 3,
"type" : "CN_CHAR",
"position" : 2
},
{
"token" : "前端",
"start_offset" : 3,
"end_offset" : 5,
"type" : "CN_WORD",
"position" : 3
},
{
"token" : "大佬",
"start_offset" : 5,
"end_offset" : 7,
"type" : "CN_WORD",
"position" : 4
}
]
}
ES数据类型
聚合:相当于mysql 中的sum(求和)
text:会分词,不支持聚合
keyword:不会分词,将全部内容作为一个词条,支持聚合
integer:数值类型
boolean:布尔
binary:二进制
integer_range, float_range, long_range, double_range, date_range :范围类型
date:日期
[ ] Nested: nested (for arrays of JSON objects 数组类型的JSON对象):数组
{ } Object: object(for single JSON objects 单个JSON对象):对象
GET:用来获取资源
POST:用来新建资源(也可以用于更新资源)
PUT:用来更新资源
DELETE:用来删除资源
- ES 5.x中一个index可以有多种type。
- ES 6.x中一个index只能有一种type。
- ES 7.x以后,将逐步移除type这个概念,现在的操作已经不再使用,默认_doc
#查看索引下的字段映射,es版本为7的可使用一下命令,在mapping?后加上format=json&include_type_name=true
GET /user/_doc/_mapping?format=json&include_type_name=true