AI大模型发展得如火如荼,可以遇见未来的千行百业都会被AI重塑,想要跟上AI科技发展的浪潮,唯有学习AI,认识AI,应用AI。于是整理了目前市面上关于AI大模型的学习资料,供你学习时选择适合自己的资料。遗憾的是书籍和课程笔者未全部看过(后续会继续分享AI实践、已阅书籍和学习课程的相关内容和经验),不知道质量怎么样?如果涉及到费用请你务必详细甄别,谨防上当受骗,看好自己的钱袋子。有人买了某培训课后觉得课程不行,但退费无门,希望你不会遇到此糟心事。

免费资源

面向开发者的大模型手册

面向开发者的大模型手册,主打 LLM 全方位入门实践。本项目基于吴恩达老师大模型系列课程内容,对原课程内容进行筛选、翻译、复现和调优,覆盖从 Prompt Engineering 到 RAG 开发、模型微调的全部流程,用最适合国内学习者的方式,指导国内开发者如何学习、入门 LLM 相关项目。

本教程适用于所有具备基础 Python 能力,想要入门 LLM 的开发者

GitHub地址:https://github.com/datawhalechina/llm-cookbook

在线阅读地址:https://datawhalechina.github.io/llm-cookbook/#/

项目star:9.6k

动手学大模型应用开发

本项目是一个面向小白开发者的大模型应用开发教程,旨在基于阿里云服务器,结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,主要内容包括:

1) 大模型简介,何为大模型、大模型特点是什么、LangChain 是什么,如何开发一个 LLM 应用,针对小白开发者的简单介绍。

2) 如何调用大模型。

3) 知识库搭建,不同类型知识库文档的加载、处理,向量数据库的搭建。

4) 构建。

5) 验证迭代,大模型开发如何实现验证迭代,一般的评估方法有什么。

本项目对学习者的人工智能基础、算法基础没有任何要求,仅需要掌握基本

GitHub地址:https://github.com/datawhalechina/llm-universe

在线阅读地址:https://datawhalechina.github.io/llm-universe/#/

项目star:2.6k

LearnPrompt

开源的 AIGC 课程, 目前已支持 ChatGPT, Midjourney, Runway, Stable Diffusion, AI数字人,AI声音&音乐,大模型微调。课程详情请访问在线阅读文档。

GitHub地址:https://github.com/LearnPrompt/LearnPrompt

在线阅读地址:https://www.learnprompt.pro/article/welcome

AI大模型学习资料_ChatGPT

课程看起来不错,值得探索。

项目star:1.6k

大模型理论基础

本项目旨在作为一个大规模预训练语言模型的教程,从数据准备、模型构建、训练策略到模型评估与改进,以及模型在安全、隐私、环境和法律道德方面的方面来提供开源知识。

项目将以斯坦福大学大规模语言模型课程和李宏毅生成式AI课程为基础,结合来自开源贡献者的补充和完善,以及对前沿大模型知识的及时更新,为读者提供较为全面而深入的理论知识和实践方法。通过对模型构建、训练、评估与改进等方面的系统性讲解,以及代码的实战。

本教程适合对人工智能和大模型感兴趣的人士或者相关从业者。

GitHub地址:https://github.com/datawhalechina/so-large-lm

在线阅读地址:https://datawhalechina.github.io/so-large-lm/#/

项目star:1k

清华 NLP X OpenBMB

大模型公开课|带你从入门到实战

Langchain 中文文档

LangChain 是一个用于开发由语言模型驱动的应用程序的框架。它使得应用程序能够:

1) 具有上下文感知能力:将语言模型连接到上下文来源(提示指令,少量的示例,需要回应的内容等)。

2) 具有推理能力:依赖语言模型进行推理(根据提供的上下文如何回答,采取什么行动等)。

网站地址:https://www.langchain.com.cn/

向量数据库

Pinecone向量库中文文档

Pinecone是一个托管的、云原生的向量数据库,具有简单的API和无需基础架构的优势。

网站地址:https://www.pinecone-io.com/docs/intro

Milvus中文文档

Milvus是在2019年创建的,其唯一目标是存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大规模嵌入向量。

作为一个专门设计用于处理输入向量查询的数据库,它能够处理万亿级别的向量索引。与现有的关系型数据库主要处理遵循预定义模式的结构化数据不同,Milvus从底层设计用于处理从非结构化数据转换而来的嵌入向量。

网站地址:https://www.milvus-io.com/

OpenAI中文开发文档

网站地址:https://www.openaidoc.com.cn/

书籍

由于AI大模型的发展日新月异,所以选取的书籍基本都是新近出版的,而且尽量在较新的书籍中选择豆瓣评分高的。

LangChain

李特丽:《LangChain入门指南:构建高可复用、可扩展的LLM应用程序》【2024出版】

李多多:《LangChain编程》【2024出版】

张海立:《LangChain实战:从原型到生产,动手打造 LLM 应用》【2024出版】

刘伟舟:《LangChain简明讲义:从0到1构建LLM应用程序》【2024出版】

AI大模型

张奇:《大规模语言模型:从理论到实践》【2024出版】

奥利维耶·卡埃朗:《大模型应用开发极简入门》【2024出版】

杨青:《大语言模型:原理与工程实践》【2024出版】

熊涛:《大语言模型:基础与前沿》【2024出版】

刘阳:《多模态大模型:新一代人工智能技术范式》【2024出版】

[法]丹尼斯·罗斯曼:《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》【2024出版】

郝少春:《ChatGPT原理与应用开发》【2024出版】

王晓华:《从零开始大模型开发与微调:基于PyTorch与ChatGLM》【2023.11出版】

黄佳:《GPT图解大模型是怎样构建的》【2023.12出版】

尤洋:《实战AI大模型》【2023.11出版】