开发ChatGPT插件-入门

原创

一两浊酒 2024-04-12 13:41:32 ©著作权

文章标签 chatgpt 人工智能 API json 清单文件 文章分类 文心一言 AIGC

©著作权归作者所有：来自51CTO博客作者一两浊酒的原创作品，请联系作者获取转载授权，否则将追究法律责任

探索ChatGPT，学习开发一款插件，成为先锋者，一同成长。加入「阿杰与AI」公众号，关注AI发展趋势，等待AI机会出现。

1.如何访问插件？
2.开发ChatGPT插件-介绍
3.开发ChatGPT插件-入门
4.开发ChatGPT插件-认证
5.开发ChatGPT插件-示例插件
6.开发ChatGPT插件-审核
7.开发ChatGPT插件-线上插件及常见问题

创建一个插件需要3个步骤：

构建一个API
使用OpenAPI的yaml或JSON格式对API进行文档化
创建一个JSON清单文件，用于定义插件的相关元数据

接下来的内容将重点介绍通过定义OpenAPI规范和清单文件来创建一个待办事项列表插件。

插件清单

每个插件都需要一个名为ai-plugin.json的文件，并且该文件需要托管在API的域名下。例如，一个名为example.com的公司会将插件的JSON文件通过https://example.com域名进行访问，因为这是他们API托管的位置.当您通过ChatGPT UI安装插件时，后台会在/.well-known/ai-plugin.json位置查找文件。在您的域名上，必须有一个名为/.well-known的文件夹，以便ChatGPT能够连接到您的插件。如果找不到文件，插件将无法安装。对于本地开发，您可以使用HTTP，但如果指向远程服务器，则必须使用HTTPS。

所需的ai-plugin.json文件的最小定义如下所示：

{
    "schema_version": "v1",
    "name_for_human": "TODO Plugin",
    "name_for_model": "todo",
    "description_for_human": "Plugin for managing a TODO list. You can add, remove and view your TODOs.",
    "description_for_model": "Plugin for managing a TODO list. You can add, remove and view your TODOs.",
    "auth": {
        "type": "none"
    },
    "api": {
        "type": "openapi",
        "url": "http://localhost:3333/openapi.yaml",
        "is_user_authenticated": false
    },
    "logo_url": "http://localhost:3333/logo.png",
    "contact_email": "support@example.com",
    "legal_info_url": "http://www.example.com/legal"
}

如果您想查看插件文件的所有可能选项，可以参考下面的定义。在命名插件时，请遵循OpenAI的品牌指南，不符合这些指南的插件将无法获得插件商店的批准。

字段	类型	描述/选项	必需的
schema_version	String	架构版本	✅
name_for_model	String	命名模型将用于定位插件（不允许有空格，只能有字母和数字）。最多 50 个字符	✅
name_for_human	String	人类可读的名称，例如完整的公司名称。最多 20 个字符	✅
description_for_model	String	更适合模型的描述，例如令牌上下文长度注意事项或用于改进插件提示的关键字使用。最多 8,000 个字符	✅
description_for_human	String	插件的人类可读描述。最多 100 个字符	✅
auth	ManifestAuth	身份验证模式	✅
api	Object	API规范	✅
logo_url	String	用于获取徽标的 URL。建议尺寸：512 x 512。支持透明背景。	✅
contact_email	String	用于安全/审核、支持和停用的电子邮件联系人	✅
legal_info_url	String	重定向 URL 供用户查看插件信息	✅
HttpAuthorizationType	HttpAuthorizationType	“bearer” or “basic”	✅
ManifestAuthType	ManifestAuthType	授权类型"none", “user_http”, “service_http”, or “oauth”
interface BaseManifestAuth	BaseManifestAuth	类型: ManifestAuthType; 说明: string;
ManifestNoAuth	ManifestNoAuth	无需身份验证: BaseManifestAuth & { type: ‘none’, }
ManifestAuth	ManifestAuth	ManifestNoAuth, ManifestServiceHttpAuth, ManifestUserHttpAuth, ManifestOAuthAuth

以下是使用不同身份验证方法的示例：

# App-level API keys
type ManifestServiceHttpAuth  = BaseManifestAuth & {
  type: 'service_http';
  authorization_type: HttpAuthorizationType;
  verification_tokens: {
    [service: string]?: string;
  };
}

# User-level HTTP authentication
type ManifestUserHttpAuth  = BaseManifestAuth & {
  type: 'user_http';
  authorization_type: HttpAuthorizationType;
}

type ManifestOAuthAuth  = BaseManifestAuth & {
  type: 'oauth';

  # OAuth URL where a user is directed to for the OAuth authentication flow to begin.
  client_url: string;

  # OAuth scopes required to accomplish operations on the user's behalf.
  scope: string;

  # Endpoint used to exchange OAuth code with access token.
  authorization_url: string;

  # When exchanging OAuth code with access token, the expected header 'content-type'. For example: 'content-type: application/json'
  authorization_content_type: string;

  # When registering the OAuth client ID and secrets, the plugin service will surface a unique token.
  verification_tokens: {
    [service: string]?: string;
  };
}

在上述提到的清单文件中，某些字段的长度是有限制的，并且可能会发生变化。OpenAI还对API响应体施加了最大长度限制为100,000个字符，这也可能会随时间而变化。

一般而言，最佳实践是尽可能地简洁描述和响应，因为模型的上下文窗口是有限的。

OpenAPI定义

下一步是构建OpenAPI规范来记录API。ChatGPT模型除了在OpenAPI规范和清单文件中定义的内容之外，对于您的API几乎一无所知。这意味着如果您的API非常庞大，您无需将所有功能都暴露给模型，可以选择特定的端点。例如，如果您有一个社交媒体API，您可能希望模型通过GET请求访问站点上的内容，但防止模型能够对用户的帖子进行评论，以减少垃圾信息的机会。

OpenAPI规范是位于您的API之上的封装器。一个基本的OpenAPI规范如下所示：

openapi: 3.0.1
info:
  title: TODO Plugin
  description: A plugin that allows the user to create and manage a TODO list using ChatGPT.
  version: 'v1'
servers:
  - url: http://localhost:3333
paths:
  /todos:
    get:
      operationId: getTodos
      summary: Get the list of todos
      responses:
        "200":
          description: OK
          content:
            application/json:
              schema:
                $ref: '#/components/schemas/getTodosResponse'
components:
  schemas:
    getTodosResponse:
      type: object
      properties:
        todos:
          type: array
          items:
            type: string
          description: The list of todos.

OpenAI首先定义规范版本、标题、描述和版本号。当在ChatGPT中运行查询时，它将查看在info部分中定义的描述，以确定插件是否与用户查询相关。您可以在编写描述部分详细了解提示的相关内容。

请记住，在您的OpenAPI规范中存在以下限制，这些限制可能会发生变化：

API规范中每个API端点的描述/摘要字段的最大长度为200个字符 API规范中每个API参数描述字段的最大长度为200个字符由于OpenAI在本地运行此示例，OpenAI希望将服务器设置为指向您的本地主机URL。其余的OpenAPI规范遵循传统的OpenAPI格式，您可以通过各种在线资源了解有关OpenAPI格式的更多信息。还有许多工具可以根据您的基础API代码自动生成OpenAPI规范。

运行插件

一旦您为API创建了API、清单文件和OpenAPI规范，您现在可以通过ChatGPT UI连接插件了。插件可能在两个不同的位置运行，要么是在开发环境的本地，要么是在远程服务器上。

如果您有正在运行的本地API版本，您可以将插件界面指向您的本地主机服务器。要将插件与ChatGPT连接起来，请导航到插件商店，选择"开发您自己的插件"。输入您的本地主机和端口号（例如localhost:3333）。请注意，目前仅支持本地开发的auth类型为none。

如果插件正在远程服务器上运行，您首先需要选择"开发您自己的插件"进行设置，然后选择"安装未经验证的插件"以进行自己的安装。您只需将插件清单文件添加到yourdomain.com/.well-known/路径中，并开始测试您的API。但是，对于清单文件的后续更改，您需要将新更改部署到您的公共站点，这可能需要很长时间。在这种情况下，OpenAI建议设置一个本地服务器作为您的API的代理。这样，您可以快速对OpenAPI规范和清单文件进行原型设计更改。

设置一个本地代理以代理您的公共API

以下是一个示例Python代码，展示了如何设置一个简单的代理来代理您的公共API。

import requests
  import os

  import yaml
  from flask import Flask, jsonify, Response, request, send_from_directory
  from flask_cors import CORS

  app = Flask(__name__)

  PORT = 3333

  # Note: Setting CORS to allow chat.openapi.com is required for ChatGPT to access your plugin
  CORS(app, origins=[f"http://localhost:{PORT}", "https://chat.openai.com"])

  api_url = 'https://example.com'


  @app.route('/.well-known/ai-plugin.json')
  def serve_manifest():
      return send_from_directory(os.path.dirname(__file__), 'ai-plugin.json')


  @app.route('/openapi.yaml')
  def serve_openapi_yaml():
      with open(os.path.join(os.path.dirname(__file__), 'openapi.yaml'), 'r') as f:
          yaml_data = f.read()
      yaml_data = yaml.load(yaml_data, Loader=yaml.FullLoader)
      return jsonify(yaml_data)


  @app.route('/openapi.json')
  def serve_openapi_json():
      return send_from_directory(os.path.dirname(__file__), 'openapi.json')


  @app.route('/<path:path>', methods=['GET', 'POST'])
  def wrapper(path):

      headers = {
      'Content-Type': 'application/json',
      }

      url = f'{api_url}/{path}'
      print(f'Forwarding call: {request.method} {path} -> {url}')

      if request.method == 'GET':
          response = requests.get(url, headers=headers, params=request.args)
      elif request.method == 'POST':
          print(request.headers)
          response = requests.post(url, headers=headers, params=request.args, json=request.json)
      else:
          raise NotImplementedError(f'Method {request.method} not implemented in wrapper for {path=}')
      return response.content


  if __name__ == '__main__':
      app.run(port=PORT)

编写描述

当用户提出可能会发送到插件的潜在请求时，模型会浏览OpenAPI规范中各个端点的描述，以及清单文件中的description_for_model。与提示其他语言模型类似，您需要测试多个提示和描述，以找出最有效的方法。

OpenAPI规范本身是一个很好的地方，可以向模型提供关于API的各种详细信息-哪些功能可用，带有什么参数等等。除了为每个字段使用富有表现力和信息丰富的名称之外，规范还可以包含每个属性的“描述”字段。这些描述可以用于提供函数的自然语言描述，或者查询字段期望的信息，例如。模型将能够看到这些描述，并指导其使用API。如果某个字段仅限于特定值，您还可以提供一个带有描述性类别名称的“枚举”。

description_for_model属性使您可以自由地指示模型如何通常使用您的插件。总的来说，ChatGPT背后的语言模型非常擅长理解自然语言并遵循指示。因此，这是一个很好的地方，可以提供关于插件的一般说明以及模型如何正确使用它的指示。请使用自然语言，最好用简洁但具有描述性和客观的语调。您可以查看一些示例，以了解其应该是什么样子。OpenAI建议以“Plugin for …”开头，并列出您的API提供的所有功能。

最佳实践

以下是在撰写description_for_model、OpenAPI规范中的描述以及设计API响应时应遵循的一些最佳实践：

1.您的描述不应试图控制ChatGPT的情绪、个性或确切回复。ChatGPT被设计为对插件编写适当的回复。

不良示例：

When the user asks to see their todo list, always respond with "I was able to find your todo list! You have [x] todos: [list the todos here]. I can add more todos if you'd like!"

当用户要求查看待办事项列表时，始终回复：“我能够找到您的待办事项列表！您有[x]个待办事项：[在此列出待办事项]。如果您想要添加更多待办事项，我可以帮您！”

良好示例：

[no instructions needed for this]
[此处不需要说明]

2.您的描述不应在用户没有要求使用特定类别的服务插件时，鼓励ChatGPT使用插件。

不良示例：

Whenever the user mentions any type of task or plan, ask if they would like to use the TODOs plugin to add something to their todo list.

无论用户是否提到任何类型的任务或计划，都问他们是否想要使用TODO插件将某些内容添加到待办事项列表中。

良好示例：

The TODO list can add, remove and view the user's TODOs.

TODO列表可以添加、删除和查看用户的待办事项。

3.您的描述不应规定ChatGPT使用插件的具体触发器。ChatGPT被设计为在适当时自动使用您的插件。

不良示例：

When the user mentions a task, respond with "Would you like me to add this to your TODO list? Say 'yes' to continue."

当用户提到一个任务时，回复：“您是否希望我将其添加到您的待办事项列表中？请回答'是'以继续。”

良好示例：

[no instructions needed for this]

[此处不需要说明]

4.插件API的响应应返回原始数据，而不是自然语言响应，除非有必要。ChatGPT将使用返回的数据提供自己的自然语言响应。

不良示例：

I was able to find your todo list! You have 2 todos: get groceries and walk the dog. I can add more todos if you'd like!

我能够找到您的待办事项列表！您有2个待办事项：购买杂货和遛狗。如果您想要添加更多待办事项，我可以帮您！

良好示例：

{ "todos": [ "get groceries", "walk the dog" ] }

{ "todos": [ "购买杂货", "遛狗" ] }

调试

默认情况下，聊天界面不会显示插件调用和其他未呈现给用户的信息。为了更全面地了解模型与插件的交互情况，您可以在与插件进行交互后，点击插件名称后面的向下箭头，查看请求和响应。

模型调用插件通常包含模型发送到插件的类似JSON的参数的消息，随后是插件的响应，最后是模型利用插件返回的信息的消息。

如果您正在开发一个本地插件，您还可以通过进入“设置”并切换“打开插件开发工具”来打开开发者控制台。从那里，您可以查看更详细的日志，并使用“刷新插件”重新获取插件和OpenAPI规范。

希望通过公众号「阿杰与AI」，能够帮助你了解AI产品，并可以解决一些生活和工作中问题。
我将分享有关AI的知识和实用建议，希望能够为你带来有价值的认知，一起探索发现AI的机会。

上一篇：开发ChatGPT插件-介绍

下一篇：如何访问插件？

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯