es UpdateRequest 更新指定字段 java elasticsearch 更新字段_elasticsearch


文章目录

  • 1.根据 ID 修改
  • 2.根据 ID 修改(不存在则插入)
  • 3.根据条件更新
  • 4.批量更新
  • 5.脚本更新
  • 5.1 数组删除元素
  • 5.2 数组删除多个元素
  • 5.3 数组追加元素
  • 5.4 数组追加多个元素
  • 5.5 数组修改元素
  • 5.6 数组修改多个元素
  • 参考文献



本文借助第三方库

olivere/elastic 完成 Go 对 ES 的更新操作。

1.根据 ID 修改

可以根据文档 ID 更新对应的文档。

比如将文档 ID 为 1 的用户名改为 “jack”。对应的 RESTful API 为:

POST es_index_userinfo/_update/1?refresh=true
{
   "doc": {
    "username": "jack"
  }
}

注意:修改不存在的文档将报 “document_missing_exception” 404 错误。

翻译成 Go 为:

// Update 修改文档
// param: index 索引; id 文档ID; m 待更新的字段键值结构
func Update(ctx context.Context, index, id string, doc interface{}) error {
	_, err := GetESClient().
		Update().
		Index(index).
		Id(id).
		Doc(doc).
		Refresh("true").
		Do(ctx)
	return err
}

// 示例
err := Update(context.Background(), index, "1", map[string]interface{}{"username": "jack"})

注意:修改不存在的文档将报elastic: Error 404 (Not Found)错误。

2.根据 ID 修改(不存在则插入)

如果文档不存在,作为新文档插入,则可以使用 upsert。

比如修改文档 ID 为 9 的部分信息,如果文档不存在则插入。对应的 RESTful API 为:

POST es_index_userinfo/_update/9?refresh=true
{
	"doc":{
		"id":       9,
		"username": "jerry",
		"age":      11
	},
	"doc_as_upsert": true
}

翻译成 Go 为:

// Upsert 修改文档(不存在则插入)
// params index 索引; id 文档ID; m 待更新的字段键值结构
func Upsert(ctx context.Context, index, id string, doc interface{}) error {
	_, err := GetESClient().
		Update().
		Index(index).
		Id(id).
		Doc(doc).
		Upsert(doc).
		Refresh("true").
		Do(ctx)
	return err
}

// 示例
m := map[string]interface{}{
	"id":       9,
	"username": "jerry",
	"age":      11,
}
err := Upsert(context.Background(), "es_index_userinfo", "9", m)

3.根据条件更新

我们也可以根据条件来更新符合条件的文档,即 Update by Query。

比如我将更新用户名为 alice,年龄小于等于 18 岁的用户昵称和祖籍。

对应的 RESTful api 为:

POST /es_index_userinfo/_update_by_query?refresh=true
{
  "query":{
     "bool":{
       "filter":[
         {"term":{"username":"alice"}},
         {"range" : {"age" : {"lte" : 18}}}
        ]
     }
  },
  "script": {
    "source": "ctx._source['nickname'] = 'cat';ctx._source['ancestral'] ='安徽'"
  }
}

注意:Refresh 只能指定 true 或 false(缺省值),不能指定 wait_for。

翻译成 Go 为:

// UpdateByQuery 根据条件修改文档
// param: index 索引; query 条件; script 脚本指定待更新的字段与值
func UpdateByQuery(ctx context.Context, index string, query elastic.Query, script *elastic.Script) (int64, error) {
	rsp, err := GetESClient().
		UpdateByQuery(index).
		Query(query).
		Script(script).
		Refresh("true").
		Do(ctx)
	if err != nil {
		return 0, err
	}
	return rsp.Updated, nil
}

// 示例
query := elastic.NewBoolQuery()
query.Filter(elastic.NewTermQuery("username", "alice"))
query.Filter(elastic.NewRangeQuery("age").Lte(18))
script := elastic.NewScriptInline("ctx._source.nickname=params.nickname;ctx._source.ancestral=params.ancestral").Params(
	map[string]interface{}{
		"nickname":  "cat",
		"ancestral": "安徽",
	})
ret, err := UpdateByQuery2ES(context.Background(), index, query, script)

4.批量更新

借助 Bulk API 可以完成对文档的批量更新。

比如对多个指定文档 ID 的用户名进行更新操作。

对应的 RESTful api 为:

// UpdateBulk 全部成功
POST /es_index_userinfo/_bulk
{"update":{"_id":"9"}}
{"doc":{"username":"tom"}}
{"update":{"_id":"10"}}
{"doc":{"username": "alice"}}

// UpdateBulk 部分成功
POST /es_index_userinfo/_bulk
{"update":{"_id":"10"}}
{"doc":{"username":"angela"}}
{"update":{"_id":"11"}}
{"doc":{"username": "bill"}}

// Upsert 理论上不会部分成功
POST /es_index_userinfo/_bulk
{"update":{"_id":"10"}}
{"doc":{"id":10, "username":"tony"}, "doc_as_upsert" : true}
{"update":{"_id":"11"}}
{"doc":{"id":11, "username": "pony"}, "doc_as_upsert" : true}

翻译成 Go 时,可借助 BulkService + BulkUpdateRequest 可实现对文档的批量修改。

// UpdateBulk 批量修改文档
func UpdateBulk(ctx context.Context, index string, ids []string, docs []interface{}) error {
	bulkService := GetESClient().Bulk().Index(index).Refresh("true")
	for i := range ids {
		doc := elastic.NewBulkUpdateRequest().
			Id(ids[i]).
			Doc(docs[i])
		bulkService.Add(doc)
	}
	res, err := bulkService.Do(ctx)
	if err != nil {
		return err
	}
	if len(res.Failed()) > 0 {
		return errors.New(res.Failed()[0].Error.Reason)
	}
	return nil
}

// UpsertBulk 批量修改文档(不存在则插入)
func UpsertBulk(ctx context.Context, index string, ids []string, docs []interface{}) error {
	bulkService := GetESClient().Bulk().Index(index).Refresh("true")
	for i := range ids {
		doc := elastic.NewBulkUpdateRequest().
			Id(ids[i]).
			Doc(docs[i]).
			Upsert(docs[i])
		bulkService.Add(doc)
	}
	res, err := bulkService.Do(ctx)
	if err != nil {
		return err
	}
	if len(res.Failed()) > 0 {
		return errors.New(res.Failed()[0].Error.Reason)
	}
	return nil
}

下面是调用示例:

func main() {
	ctx := context.Background()
	// UpdateBulk 全部成功
	// id 9 和 10 均存在
	ids := []string{"9", "10"}
	docs := []interface{}{
		map[string]interface{}{
			"username": "tom",
		},
		map[string]interface{}{
			"username": "alice",
		},
	}
	err := UpdateBulk(ctx, "es_index_userinfo", ids, docs)
	fmt.Printf("UpdateBulk all success err is %v\n", err)

	// UpdateBulk 部分成功
	// id 10 存在,id 11 文档不存在
	ids = []string{"10", "11"}
	docs = []interface{}{
		map[string]interface{}{
			"username": "angela",
		},
		map[string]interface{}{
			"username": "bill",
		},
	}
	err = UpdateBulk(ctx, "es_index_userinfo", ids, docs)
	fmt.Printf("UpdateBulk partial success err is %v\n", err)
	
	// UpsertBulk 理论上不会部分成功
	ids = []string{"10", "11"}
	docs = []interface{}{
		map[string]interface{}{
			"id":       10,
			"username": "tony",
		},
		map[string]interface{}{
			"id":       11,
			"username": "pony",
		},
	}
	err = UpsertBulk(ctx, "es_index_userinfo", ids, docs)
	fmt.Printf("UpsertBulk all success err is %v\n", err)
}

分别输出:

UpdateBulk all success err is <nil>
UpdateBulk partial success err is [_doc][11]: document missing
UpsertBulk all success err is <nil>

5.脚本更新

有时简单的字段赋值无法满足复杂的业务场景。复杂一点的更新逻辑,可能需要借助于脚本来完成。

如何书写更新脚本,官网给了入门说明和示例,建议大家先看一下 How to write scripts

5.1 数组删除元素

ES 中每一个字段都是数组,我们无需对字段做额外的设置,便可以将其当作数组来使用。

当然,实际使用时,其类型必须是一个数组,而不是一个值。什么意思呢?就是我们可以给字段添加多个值,那么此时它便成了数组。只有字段变成一个数组时,我们才可以把它当作数组来用,比如取元素下标。如果不是数组,那么会失败。比如下面的删除数组中的某个元素,如果删除时,其不是数组,只是一个字段值,那么脚本会执行失败。

现在我想删除指定用户的 phone 字段中的某个电话号码,我们可以借助脚本来完成。注意,我们要先查到这个 phone 字段中包含这个号码,不然脚本在执行时会失败。

POST /es_index_userinfo/_update_by_query
{
  "query":{
    "bool":{
      "filter": [
        {"term":{"username":"angela"}},
        {"term":{"phone":18819064334}}
      ]
    }
  },
  "script": {
    "source": "ctx._source.phone.remove(ctx._source.phone.indexOf(params.phone))",
    "params": {
      "phone": 18819064334
    }
  }
}

对应 Go 条件与脚本:

// 查询条件。
boolQuery := elastic.NewBoolQuery().
	Filter(elastic.NewTermQuery("username", "angela")).
	Filter(elastic.NewTermQuery("phone", 18819064334))

// 删除脚本。
scriptStr := "ctx._source.phone.remove(ctx._source.phone.indexOf(params.phone))"
script := elastic.NewScript(scriptStr).Params(
	map[string]interface{}{
		"phone": 18819064334
	})

5.2 数组删除多个元素

同样地,我们可以使用脚本删除数组中的多个元素,并更新时间戳。

POST /es_index_userinfo/_update_by_query
{
  "query":{
    "bool":{
      "filter": [
        {"term":{"username":"angela"}}
      ]
    }
  },
  "script": {
    "source": "for (int i = 0; i < params.phones.length; i++) {if (ctx._source.phone.contains(params.phones[i])) {ctx._source.phone.remove(ctx._source.phone.indexOf(params.phones[i]))}} ctx._source.upd_uts=params.now",
    "params": {
      "phones": [18819064334,18819064335],
      "now":1649839099
    }
  }
}

因为我们在脚本中进行了元素是否存在于数组中的判断,所以不用在查询条件中指定要包含的号码。

对应 Go 条件与脚本:

boolQuery := elastic.NewBoolQuery().
	Filter(elastic.NewTermQuery("username", "angela"))
	scriptStr := `for (int i = 0; i < params.phones.length; i++) {
		if (ctx._source.phone.contains(params.phones[i])) { 	
			ctx._source.phone.remove(ctx._source.phone.indexOf(params.phones[i]))
		}
	}
	ctx._source.upd_uts=params.now`
	script := elastic.NewScript(scriptStr).Params(
		map[string]interface{}{
			"phones": [18819064334,18819454334]
		})

5.3 数组追加元素

我们可以借助脚本向数组字段追加元素。

比如我需要操作的某个字段 tags:[“tag1”,”tag2”,”tag3’],现在发现了一个新标签 ”tag4”,需要加入到 tags 中。

POST <index>/_update/<id>
{
   "script" : {
       "source": "ctx._source.tags.add(params.new_tag)",
       "params" : {
          "new_tag" : "tag4"
       }
   }
}

对应 Go 条件与脚本:

// 条件。
query := elastic.NewTermQuery("_id", id)

// 脚本。
script := elastic.NewScript("ctx._source.tags.add(params.new_tag)").Params(
	map[string]interface{}{
		"new_tag": "tag4",
	})

5.4 数组追加多个元素

我们可以借助脚本向数组字段追加元素。

比如我需要操作的某个字段 tags:[“tag1”,”tag2”,”tag3’],现在发现了多个新标签,比如 ”tag4” 和 “tag5”,需要加入到 tags 中。

POST <index>/_update/<id>
{
   "script" : {
       "source": "ctx._source.tags.addAll(params.new_tags)",
       "params" : {
          "new_tags" : ["tag4","tag5"]
       }
   }
}

对应 Go 条件与脚本:

// 条件。
query := elastic.NewTermQuery("_id", id)

// 脚本。
script := elastic.NewScript("ctx._source.tags.addAll(params.new_tags)").Params(
	map[string]interface{}{
		"new_tags": []string{"tag4", "tag5"},
	})

5.5 数组修改元素

我们可以借助脚本修改数组中的元素。

比如我需要修改字段 tags:[“tag1”,”tag2”,”tag3’],将 tag3 变成 label3。

POST <index>/_update_by_query
{
  "query":{
    "term":{"tags":"tag3"}
  },
   "script" : {
       "source": "ctx._source.tags[ctx._source.tags.indexOf(params.old_tag)]=params.new_tag",
       "params" : {
          "old_tag" : "tag3",
          "new_tag" : "label3"
       }
   }
}

对应 Go 条件与脚本:

// 条件。
query := elastic.NewTermQuery("tags", "tag3")

// 脚本。
script := elastic.NewScript("ctx._source.tags[ctx._source.tags.indexOf(params.old_tag)]=params.new_tag").Params(
	map[string]interface{}{
		"old_tag" : "tag3",
		"new_tag": "label3",
	})

5.6 数组修改多个元素

我们可以借助脚本修改数组中的元素。

比如我需要修改数组 tags:[“tag1”,”tag2”,”tag3’],将 tag1 和 tag3 变成 label。此时,我们需要遍历原数组,将符合条件的元素逐个替换。

POST <index>/_update_by_query
{
  "query":{
    "terms":{"tags":["tag1","tag3"]}
  },
   "script" : {
       "source": "for (int i=0; i<ctx._source.tags.length; i++) {if (params.old_tags.contains(ctx._source.tags[i])) {ctx._source.tags[i] = params.new_tag}}",
       "params" : {
          "old_tags" : ["tag1","tag3"],
          "new_tag" : "label"
       }
   }
}

对应 Go 条件与脚本:

// 条件。
query := elastic.NewTermsQuery("tags", "tag1", "tag3"))

// 脚本。
script := elastic.NewScript(`
	for (int i=0; i<ctx._source.tags.length; i++) {
		if (params.old_tags.contains(ctx._source.tags[i])) {
			ctx._source.tags[i] = params.new_tag
		}
	}
`).Params(
	map[string]interface{}{
		"old_tags": ["tag1", "tag3"],
		"new_tag": "label",
	})

参考文献

elastic - pkg.develastic - type UpdateServiceelastic - type UpdateByQueryServiceelastic - type BulkServiceelastic - type BulkUpdateRequestElasticsearch Guide [7.15] » REST APIs » Document APIs » Update APIElasticsearch Guide [7.13] » REST APIs » Document APIs » Update By Query APIElasticsearch Guide [7.15] » REST APIs » Document APIs » Bulk APIElasticsearch Guide [8.1] » Scripting » How to write scripts