一、简介
- 实体识别能够从自然语言中提取出具有特定意义的实体,并在此基础上完成搜索等一系列相关操作及功能。
- 实体识别覆盖范围大,能够满足日常开发中对实体识别的需求,让应用体验更好。识别准确率高,能够准确地提取到实体信息,对应用基于信息的后续服务形成关键影响。
- 实体识别当前只支持中文语境。
- 实体识别文本限制在 500 个字符以内,超过字符数限制将返回参数错误;文本需要为 UTF-8 格式,格式错误不报错,但会导致分析结果错误。
- Engine 支持多用户同时接入,但是不支持同一用户并发调用同一个特性,如同一个特性被同一进程同一时间多次调用,则返回系统忙错误;不同进程调用同一特性,则同一时间只处理一个进程的业务,其他进程进入队列排队。
二、应用场景
- 双指按压文本弹出卡片:基于文本中所包含的实体内容,如名人、电影、电视剧等。通过双指按压,快速弹出实体对应的卡片介绍信息。让用户可以方便、快捷的获取想知道的信息。
- 实体信息高亮:将相关的实体信息高亮,并设置快速操作入口。如将文本信息中的电话号码高亮,用户可以直接进行拨号。
三、API 说明
- 实体识别提供识别文本中具有特定意义实体的能力,包含电影、电视剧、综艺、动漫、单曲、专辑、图书、火车车次、航班号、球队、人名、快递单号、电话号码、url、邮箱、联赛、时间、地点(包含酒店、餐馆、景点、学校、道路、省、市、县、区、镇等)、验证码。
① 主要接口
接口名 | 描述 |
void init(Context context, OnResultListener listener, boolean isLoadModel); | 初始化NLU服务。在调用NLU等功能接口前需要先调用此接口,在OnResultListener的onResult(T)方法中获取到回调结果后,再调用NLU功能接口。开发者传入listener参数作为回调,用于等待NLU功能接口的调用过程和结果 |
ResponseResult getEntity(String requestData, int requestType); | 采用同步方式识别文本中具有特定意义的实体,包含电影、电视剧、综艺、动漫、单曲、专辑、图书、火车车次、航班号、球队、人名、快递单号、电话号码、url、邮箱、联赛、时间、地点(包含酒店、餐馆、景点、学校、道路、省、市、县、区、镇等)、验证码 |
ResponseResult getEntity(final String requestData, final int requestType, final OnResultListener listener); | 采用异步方式识别文本中具有特定意义的实体,包含电影、电视剧、综艺、动漫、单曲、专辑、图书、火车车次、航班号、球队、人名、快递单号、电话号码、url、邮箱、联赛、时间、地点(包含酒店、餐馆、景点、学校、道路、省、市、县、区、镇等)、验证码 |
void destroy(Context context); | 取消所有NLU任务,销毁NLU引擎服务。调用此方法后,无法再使用NLU服务。如果需要重新使用NLU服务,需要重新调用init(Context, OnResultListener, boolean)}来初始化NLU服务 |
② 接口输入值说明
- requestType 表示请求类型,通过 NluRequestType 类定义如下:
枚举的类型 | 枚举的取值 |
static final int | REQUEST_TYPE_LOCAL = 0 本地请求 |
- requestData 的 json 格式如下:
参数名 | 是否必选 | 类型 | 说明 |
text | true | String | 待分析的文本,UTF-8编码,限制500个字符以内 |
定义需要分析的实体,默认所有实体均会分析。 分析某个实体,传实体键值,例如:只需要分析时间实体,传“time”。可传多个,表示分析多个实体,以半角逗号“,”分隔,例如:分析时间和地点,传“time,location”。 取值范围:name、time、location、phoneNum、email、url、movie、tv、anime、league、team、trainNo、flightNo、expressNo、idNo、verificationCode、app、carNo | |||
callPkg | false | String | 调用者名称 |
callType | false | int | 调用者类型: 0:普通应用(默认) 1:快应用 |
callVersion callState | false false | String int | 调用者版本号。 调用者状态: -1:未知(默认) 0:前台 1:后台 |
③ 接口返回值说明
- 返回值 ResponseResult 为 JSONObject 字符串,体现实体识别的结果:
参数名 | 是否必选 | 类型 | 说明 |
code | true | int | 实体识别的结果码。取值包括: 0:成功 1:系统正在初始化 2:参数错误 3:系统忙 4:系统异常 5:任务超时 6:其它错误 |
message | true | String | 实体识别的结果描述 |
entity | false | JSONObject | 实体分析结果 |
四、开发流程
- 在使用实体识别相关接口时,需要将实体识别的相关类添加到工程:
import ohos.ai.nlu.ResponseResult; // 接口返回的结果类
import ohos.ai.nlu.NluClient; // 接口服务类
import ohos.ai.nlu.NluRequestType; // 接口调用时传入的类型
import ohos.ai.nlu.OnResultListener; // 异步函数,执行成功的回调结果类
import ohos.ai.nlu.util.NluError;// 接口返回码
- 使用 NluClient 静态类进行初始化,通过异步方式获取服务的连接。
- context:应用上下文信息,应为 ohos.aafwk.ability.Ability 或 ohos.aafwk.ability.AbilitySlice 的实例或子类实例。
- listener:初始化结果的回调,可以传 null。
- isLoadModel:是否加载模型,如果传 true,则在初始化时加载模型;如果传 false,则在初始化时不加载模型。
NluClient.getInstance().init(context, new OnResultListener<Integer>(){
@Override
public void onResult(Integer result){
// 初始化成功回调,在服务初始化成功调用该函数
}
}, true);
- 调用实体识别的接口,获取分析结果。
- 采用同步方式进行实体识别:
String requestData= "{text:'我要看电影魔兽',module:'movie'}"; // module为可选参数,如果不设置该参数,则默认分析所有实体
ResponseResult respResult = NluClient.getInstance().getEntity(requestData, NluRequestType.REQUEST_TYPE_LOCAL);
if (null != respResult && NluError.SUCCESS_RESULT == respResult.getCode()) {
// 获取接口返回结果,参考接口文档返回使用
String result = respResult.getResponseResult();
}
- 采用异步方式进行实体识别:
// 待分析文本
String requestData= "{text:'我要看电影魔兽',module:'movie'}"; // module为可选参数,如果不设置该参数,则默认分析所有实体
// 调用接口
NluClient.getInstance().getEntity(requestData, NluRequestType.REQUEST_TYPE_LOCAL, new OnResultListener < ResponseResult > () {
@Override
public void onResult(ResponseResult respResult) {
// 异步返回
if (null != respResult && NluError.SUCCESS_RESULT == respResult.getCode()) {
// 获取接口返回结果,参考接口文档返回使用
String result = respResult.getResponseResult();
}
}
});
- 销毁 NLU 服务:
NluClient.getInstance().destroy();