声明:本文是 Preethi Cheguri 所著文章《ChatGPT Equivalent Is Open-Source, But it Is of No Use to Developers》的中文译文。

原文链接:https://www.analyticsinsight.net/chatgpt-equivalent-is-open-source-but-it-is-of-no-use-to-developers/


类似于 ChatGPT 的软件现已开源,但这似乎对开发者们来说无用

第一个类似于 ChatGPT 的开源软件已经出现:这是一款基于谷歌 5,400 亿个参数的语言大模型 PaLM 架构,以及使用 RLHF(Reinforcement Learning from Human Feedback,即:使用强化学习的方法,利用人类反馈信号直接优化语言模型)的应用程序。“PaLM + RLHF” 复刻了 ChatGPT,并且现在已经开源,它是由负责逆向工程闭源 AI 系统(比如 Meta 发布的 Make-A-Video)的开发者,开发出来的一个功能类似于 ChatGPT 的文本生成模型。为了构建一个几乎可以完成 ChatGPT 任何任务的系统,包括起草电子邮件和代码提示,该系统结合了谷歌的语言大模型 PaLM 以及人类反馈强化学习(RLHF)的方法。

为什么这个“开源 ChatGPT”对开发人员没有用?

“PaLM + RLHF” 未经过预训练,换句话说:系统还没有接受网络上示例数据的必要训练,使其真正发挥作用。下载 “PaLM + RLHF” 后的体验感和使用 ChatGPT 时并不一致,“PaLM + RLHF” 需要生成该模型可以学习的千兆字节文本,然后找到能够处理训练需求的硬件。这是一个非常昂贵的过程,除非有资金雄厚的企业(或个人)专门去研究并供公众使用,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。

好消息是,复刻 ChatGPT 的其他几个项目发展迅速,包括研究团队 CarperAI 运营的项目。CarperAI 将与 OpenAI 研究小组 EleutherAI、初创公司 Scale AI 和 Hugging Face 合作,发布第一个由人类反馈训练的 “类-ChatGPT 即用型 AI 模型”。非营利组织 LAION 率先开展了一个使用最新的机器学习方法来复刻 ChatGPT 的项目,LAION 也为训练 Stable Diffusion 提供了初始数据集。那么使用了 RLHF 的 PaLM 应用程序能够做些什么?随着模型规模的扩大,跨活动的性能不断提高,新的机会也将出现。PaLM 可扩展到 5,400 亿个参数,相比之下,GPT-3 大约只有 1,750 亿个参数。

“ChatGPT” 与 “PaLM + RLHF”

带有人类反馈的强化学习是一种旨在更好地将语言模型与用户期望的目标保持一致的方法,同时也是 ChatGPT 与 “PaLM + RLHF” 都拥有的秘密武器。RLHF 需要使用包含提示的数据集微调语言模型,且该提示与人类志愿者预期模型将要表达的内容相匹配,例如:提示 “向 6 岁孩子解释机器学习”;回答 “机器学习是 AI 的一种形式……”。

“PaLM + RLHF” 中使用了 PaLM 语言模型。在反馈上述提示到改进后的模型中,由此生成多个回应,志愿者将每个回应由好到差进行排名,然后使用该排名来训练 “奖励模型”,此模型采用原始模型的回应并按偏好顺序对它们进行排序,然后过滤出给定提示的最佳答案。收集训练数据这个过程非常昂贵。

此外,训练过程也不便宜。PaLM 有 5,400 亿参数/语言模型组件,这些都是从训练数据中所习得的。而 2020 年的一项研究表明,开发一个只有 15 亿个参数的文本生成模型的费用可能高达 160 万美元。耗时三个月,训练了拥有 1,760 亿个参数的开源模型 Bloom,用了 384 个 Nvidia A100 GPU(每一个需要数千美金)。而运行 “PaLM + RLHF” 大小的训练模型同样也不简单。Bloom 需要配备装有大约八个 A100 GPU 的专用 PC。每年估计在单个的亚马逊网站服务实例上,运行 OpenAI 的文本生成 GPT-3(包含超过 1,750亿 个参数)的成本约为 87,000 美元。

结论:除非有资金雄厚的企业(或个人)投入训练,并公之于众,否则 “PaLM + RLHF” 目前还无法取代 ChatGPT。


免责声明:本文提供的信息仅代表作者/广告商的意见,而非投资建议——仅用于教育目的。通过阅读本文,文中信息并不构成 Analytics Insight 及团队的任何投资或财务建议。投资者应该寻求自己的独立财务或专业建议。在做出任何投资决定之前,请与财务顾问一起进行独立研究。Analytics Insight 和团队不对本文中提供的投资观点负责。


开源雨林围绕开源通识、开源使用、开源贡献三大方面构建知识体系,愿把长期积累的经验系统化分享给企业,在团队、机制、项目三方面提供合作,推动各企业更高效地使用开源、贡献开源,提升全行业开源技术与应用水平。 开源雨林的内容已开源,并托管在 https://github.com/opensource-rainforest ,欢迎通过 Pull Request 的形式贡献内容,通过 Issue 的形式展开讨论,共同维护开源雨林的内容。 欢迎关注“开源雨林”公众号,获取最新、最全的消息。