大语言模型在医药健康领域的应用

原创

Android老皮 2025-01-08 17:23:04 ©著作权

文章标签 语言模型人工智能自然语言处理大模型 LLM 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者Android老皮的原创作品，请联系作者获取转载授权，否则将追究法律责任

标题：仲景——首个实现从预训练到 RLHF 全流程训练的中文医疗大模型

不愧是中了博后基金的佬团队的成果。与之前发过的TCMChat等相比，主要应用领域为中文医学而非中医药，但选取的基座模型LLaMA在中文NLP任务上的性能可能并非最优。

代码地址：https://github.com/SupritYoung/Zhongjing

大语言模型在医药健康领域的应用_大模型

发表日期：2023-08-07（AAAI 2024）

摘要：大语言模型（LLM）的最新进展在理解和响应用户意图方面取得了显著突破。然而，在某些专业领域，如中文医学领域，它们的性能却落后于一般用例。将中文医学纳入 LLM 的现有努力依赖于使用单轮和精炼对话数据的监督微调（SFT）。这些模型缺乏类似医生的主动询问和多轮理解能力，也无法使回答与专家的意图对齐。在这篇论文中，我们介绍了首个基于中文医学 LLaMA 的 LLM–“仲景”，它实现了从预训练、SFT 到从人类反馈中强化学习（RLHF）的整个训练流水线。此外，我们还构建了一个包含 70,000 个真实医患对话的中文多轮医学对话数据集 CMtMedQA，这大大增强了模型处理复杂对话和主动发起询问的能力。鉴于生物医学领域的独特性，我们还定义了细化的注释规则和评估标准。广泛的实验结果表明，尽管参数是 ChatGPT（175B）的 100 倍，但仲景在各种能力上都优于基线，并在某些能力上与 ChatGPT 不相上下。消融研究也证明了每个组件的贡献：预训练增强了医学知识，而 RLHF 则进一步提高了遵从指令的能力和安全性。

大语言模型在医药健康领域的应用_人工智能_02

论文地址：https://arxiv.org/abs/2308.03549

上一篇：LangChain实战 | Tool Calling ：让AI真正动起来的关键技术

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯