本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与算法,并且配以示例与代码(伪代码)帮助读者理解特定算法的实现逻辑。由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在梳理最具代表性的基础知识内容,帮助读者更好地了解大语言模型技术的核心知识点,能够快速上手相关的科研与工程项目。
本书共设置了五个主要部分,分别是背景与基础知识部分、预训练部分、微调与对齐部分、大模型使用部分以及评测与应用部分。
第一部分:背景与基础知识
第二部分:预训练
第三部分:微调与对齐部分
第四部分:大模型使用
第五部分:评测与应用