探索ChatGPT,学习开发一款插件,成为先锋者,一同成长。加入「阿杰与AI」公众号,关注AI发展趋势,等待AI机会出现。
- 1.如何访问插件?
- 2.开发ChatGPT插件-介绍
- 3.开发ChatGPT插件-入门
- 4.开发ChatGPT插件-认证
- 5.开发ChatGPT插件-示例插件
- 6.开发ChatGPT插件-审核
- 7.开发ChatGPT插件-线上插件及常见问题
创建一个插件需要3个步骤:
- 构建一个API
- 使用OpenAPI的yaml或JSON格式对API进行文档化
- 创建一个JSON清单文件,用于定义插件的相关元数据
接下来的内容将重点介绍通过定义OpenAPI规范和清单文件来创建一个待办事项列表插件。
插件清单
每个插件都需要一个名为ai-plugin.json的文件,并且该文件需要托管在API的域名下。例如,一个名为example.com的公司会将插件的JSON文件通过https://example.com域名进行访问,因为这是他们API托管的位置.当您通过ChatGPT UI安装插件时,后台会在/.well-known/ai-plugin.json位置查找文件。在您的域名上,必须有一个名为/.well-known的文件夹,以便ChatGPT能够连接到您的插件。如果找不到文件,插件将无法安装。对于本地开发,您可以使用HTTP,但如果指向远程服务器,则必须使用HTTPS。
所需的ai-plugin.json文件的最小定义如下所示:
{
"schema_version": "v1",
"name_for_human": "TODO Plugin",
"name_for_model": "todo",
"description_for_human": "Plugin for managing a TODO list. You can add, remove and view your TODOs.",
"description_for_model": "Plugin for managing a TODO list. You can add, remove and view your TODOs.",
"auth": {
"type": "none"
},
"api": {
"type": "openapi",
"url": "http://localhost:3333/openapi.yaml",
"is_user_authenticated": false
},
"logo_url": "http://localhost:3333/logo.png",
"contact_email": "support@example.com",
"legal_info_url": "http://www.example.com/legal"
}
如果您想查看插件文件的所有可能选项,可以参考下面的定义。在命名插件时,请遵循OpenAI的品牌指南,不符合这些指南的插件将无法获得插件商店的批准。
字段 | 类型 | 描述/选项 | 必需的 |
schema_version | String | 架构版本 | ✅ |
name_for_model | String | 命名模型将用于定位插件(不允许有空格,只能有字母和数字)。最多 50 个字符 | ✅ |
name_for_human | String | 人类可读的名称,例如完整的公司名称。最多 20 个字符 | ✅ |
description_for_model | String | 更适合模型的描述,例如令牌上下文长度注意事项或用于改进插件提示的关键字使用。最多 8,000 个字符 | ✅ |
description_for_human | String | 插件的人类可读描述。最多 100 个字符 | ✅ |
auth | ManifestAuth | 身份验证模式 | ✅ |
api | Object | API规范 | ✅ |
logo_url | String | 用于获取徽标的 URL。建议尺寸:512 x 512。支持透明背景。 | ✅ |
contact_email | String | 用于安全/审核、支持和停用的电子邮件联系人 | ✅ |
legal_info_url | String | 重定向 URL 供用户查看插件信息 | ✅ |
HttpAuthorizationType | HttpAuthorizationType | “bearer” or “basic” | ✅ |
ManifestAuthType | ManifestAuthType | 授权类型"none", “user_http”, “service_http”, or “oauth” | |
interface BaseManifestAuth | BaseManifestAuth | 类型: ManifestAuthType; 说明: string; | |
ManifestNoAuth | ManifestNoAuth | 无需身份验证: BaseManifestAuth & { type: ‘none’, } | |
ManifestAuth | ManifestAuth | ManifestNoAuth, ManifestServiceHttpAuth, ManifestUserHttpAuth, ManifestOAuthAuth |
以下是使用不同身份验证方法的示例:
# App-level API keys
type ManifestServiceHttpAuth = BaseManifestAuth & {
type: 'service_http';
authorization_type: HttpAuthorizationType;
verification_tokens: {
[service: string]?: string;
};
}
# User-level HTTP authentication
type ManifestUserHttpAuth = BaseManifestAuth & {
type: 'user_http';
authorization_type: HttpAuthorizationType;
}
type ManifestOAuthAuth = BaseManifestAuth & {
type: 'oauth';
# OAuth URL where a user is directed to for the OAuth authentication flow to begin.
client_url: string;
# OAuth scopes required to accomplish operations on the user's behalf.
scope: string;
# Endpoint used to exchange OAuth code with access token.
authorization_url: string;
# When exchanging OAuth code with access token, the expected header 'content-type'. For example: 'content-type: application/json'
authorization_content_type: string;
# When registering the OAuth client ID and secrets, the plugin service will surface a unique token.
verification_tokens: {
[service: string]?: string;
};
}
在上述提到的清单文件中,某些字段的长度是有限制的,并且可能会发生变化。OpenAI还对API响应体施加了最大长度限制为100,000个字符,这也可能会随时间而变化。
一般而言,最佳实践是尽可能地简洁描述和响应,因为模型的上下文窗口是有限的。
OpenAPI定义
下一步是构建OpenAPI规范来记录API。ChatGPT模型除了在OpenAPI规范和清单文件中定义的内容之外,对于您的API几乎一无所知。这意味着如果您的API非常庞大,您无需将所有功能都暴露给模型,可以选择特定的端点。例如,如果您有一个社交媒体API,您可能希望模型通过GET请求访问站点上的内容,但防止模型能够对用户的帖子进行评论,以减少垃圾信息的机会。
OpenAPI规范是位于您的API之上的封装器。一个基本的OpenAPI规范如下所示:
openapi: 3.0.1
info:
title: TODO Plugin
description: A plugin that allows the user to create and manage a TODO list using ChatGPT.
version: 'v1'
servers:
- url: http://localhost:3333
paths:
/todos:
get:
operationId: getTodos
summary: Get the list of todos
responses:
"200":
description: OK
content:
application/json:
schema:
$ref: '#/components/schemas/getTodosResponse'
components:
schemas:
getTodosResponse:
type: object
properties:
todos:
type: array
items:
type: string
description: The list of todos.
OpenAI首先定义规范版本、标题、描述和版本号。当在ChatGPT中运行查询时,它将查看在info部分中定义的描述,以确定插件是否与用户查询相关。您可以在编写描述部分详细了解提示的相关内容。
请记住,在您的OpenAPI规范中存在以下限制,这些限制可能会发生变化:
API规范中每个API端点的描述/摘要字段的最大长度为200个字符 API规范中每个API参数描述字段的最大长度为200个字符 由于OpenAI在本地运行此示例,OpenAI希望将服务器设置为指向您的本地主机URL。其余的OpenAPI规范遵循传统的OpenAPI格式,您可以通过各种在线资源了解有关OpenAPI格式的更多信息。还有许多工具可以根据您的基础API代码自动生成OpenAPI规范。
运行插件
一旦您为API创建了API、清单文件和OpenAPI规范,您现在可以通过ChatGPT UI连接插件了。插件可能在两个不同的位置运行,要么是在开发环境的本地,要么是在远程服务器上。
如果您有正在运行的本地API版本,您可以将插件界面指向您的本地主机服务器。要将插件与ChatGPT连接起来,请导航到插件商店,选择"开发您自己的插件"。输入您的本地主机和端口号(例如localhost:3333)。请注意,目前仅支持本地开发的auth类型为none。
- 如果插件正在远程服务器上运行,您首先需要选择"开发您自己的插件"进行设置,然后选择"安装未经验证的插件"以进行自己的安装。您只需将插件清单文件添加到yourdomain.com/.well-known/路径中,并开始测试您的API。但是,对于清单文件的后续更改,您需要将新更改部署到您的公共站点,这可能需要很长时间。在这种情况下,OpenAI建议设置一个本地服务器作为您的API的代理。这样,您可以快速对OpenAPI规范和清单文件进行原型设计更改。
设置一个本地代理以代理您的公共API
- 以下是一个示例Python代码,展示了如何设置一个简单的代理来代理您的公共API。
import requests
import os
import yaml
from flask import Flask, jsonify, Response, request, send_from_directory
from flask_cors import CORS
app = Flask(__name__)
PORT = 3333
# Note: Setting CORS to allow chat.openapi.com is required for ChatGPT to access your plugin
CORS(app, origins=[f"http://localhost:{PORT}", "https://chat.openai.com"])
api_url = 'https://example.com'
@app.route('/.well-known/ai-plugin.json')
def serve_manifest():
return send_from_directory(os.path.dirname(__file__), 'ai-plugin.json')
@app.route('/openapi.yaml')
def serve_openapi_yaml():
with open(os.path.join(os.path.dirname(__file__), 'openapi.yaml'), 'r') as f:
yaml_data = f.read()
yaml_data = yaml.load(yaml_data, Loader=yaml.FullLoader)
return jsonify(yaml_data)
@app.route('/openapi.json')
def serve_openapi_json():
return send_from_directory(os.path.dirname(__file__), 'openapi.json')
@app.route('/<path:path>', methods=['GET', 'POST'])
def wrapper(path):
headers = {
'Content-Type': 'application/json',
}
url = f'{api_url}/{path}'
print(f'Forwarding call: {request.method} {path} -> {url}')
if request.method == 'GET':
response = requests.get(url, headers=headers, params=request.args)
elif request.method == 'POST':
print(request.headers)
response = requests.post(url, headers=headers, params=request.args, json=request.json)
else:
raise NotImplementedError(f'Method {request.method} not implemented in wrapper for {path=}')
return response.content
if __name__ == '__main__':
app.run(port=PORT)
编写描述
当用户提出可能会发送到插件的潜在请求时,模型会浏览OpenAPI规范中各个端点的描述,以及清单文件中的description_for_model。与提示其他语言模型类似,您需要测试多个提示和描述,以找出最有效的方法。
OpenAPI规范本身是一个很好的地方,可以向模型提供关于API的各种详细信息-哪些功能可用,带有什么参数等等。除了为每个字段使用富有表现力和信息丰富的名称之外,规范还可以包含每个属性的“描述”字段。这些描述可以用于提供函数的自然语言描述,或者查询字段期望的信息,例如。模型将能够看到这些描述,并指导其使用API。如果某个字段仅限于特定值,您还可以提供一个带有描述性类别名称的“枚举”。
description_for_model属性使您可以自由地指示模型如何通常使用您的插件。总的来说,ChatGPT背后的语言模型非常擅长理解自然语言并遵循指示。因此,这是一个很好的地方,可以提供关于插件的一般说明以及模型如何正确使用它的指示。请使用自然语言,最好用简洁但具有描述性和客观的语调。您可以查看一些示例,以了解其应该是什么样子。OpenAI建议以“Plugin for …”开头,并列出您的API提供的所有功能。
最佳实践
以下是在撰写description_for_model、OpenAPI规范中的描述以及设计API响应时应遵循的一些最佳实践:
1.您的描述不应试图控制ChatGPT的情绪、个性或确切回复。ChatGPT被设计为对插件编写适当的回复。
不良示例:
When the user asks to see their todo list, always respond with "I was able to find your todo list! You have [x] todos: [list the todos here]. I can add more todos if you'd like!"
当用户要求查看待办事项列表时,始终回复:“我能够找到您的待办事项列表!您有[x]个待办事项:[在此列出待办事项]。如果您想要添加更多待办事项,我可以帮您!”
良好示例:
[no instructions needed for this]
[此处不需要说明]
2.您的描述不应在用户没有要求使用特定类别的服务插件时,鼓励ChatGPT使用插件。
不良示例:
Whenever the user mentions any type of task or plan, ask if they would like to use the TODOs plugin to add something to their todo list.
无论用户是否提到任何类型的任务或计划,都问他们是否想要使用TODO插件将某些内容添加到待办事项列表中。
良好示例:
The TODO list can add, remove and view the user's TODOs.
TODO列表可以添加、删除和查看用户的待办事项。
3.您的描述不应规定ChatGPT使用插件的具体触发器。ChatGPT被设计为在适当时自动使用您的插件。
不良示例:
When the user mentions a task, respond with "Would you like me to add this to your TODO list? Say 'yes' to continue."
当用户提到一个任务时,回复:“您是否希望我将其添加到您的待办事项列表中?请回答'是'以继续。”
良好示例:
[no instructions needed for this]
[此处不需要说明]
4.插件API的响应应返回原始数据,而不是自然语言响应,除非有必要。ChatGPT将使用返回的数据提供自己的自然语言响应。
不良示例:
I was able to find your todo list! You have 2 todos: get groceries and walk the dog. I can add more todos if you'd like!
我能够找到您的待办事项列表!您有2个待办事项:购买杂货和遛狗。如果您想要添加更多待办事项,我可以帮您!
良好示例:
{ "todos": [ "get groceries", "walk the dog" ] }
{ "todos": [ "购买杂货", "遛狗" ] }
调试
默认情况下,聊天界面不会显示插件调用和其他未呈现给用户的信息。为了更全面地了解模型与插件的交互情况,您可以在与插件进行交互后,点击插件名称后面的向下箭头,查看请求和响应。
模型调用插件通常包含模型发送到插件的类似JSON的参数的消息,随后是插件的响应,最后是模型利用插件返回的信息的消息。
如果您正在开发一个本地插件,您还可以通过进入“设置”并切换“打开插件开发工具”来打开开发者控制台。从那里,您可以查看更详细的日志,并使用“刷新插件”重新获取插件和OpenAPI规范。
希望通过公众号「阿杰与AI」,能够帮助你了解AI产品,并可以解决一些生活和工作中问题。
我将分享有关AI的知识和实用建议,希望能够为你带来有价值的认知,一起探索发现AI的机会。