自己搭建专属AI：Llama大模型私有化部署

原创

蚁景网安实验室 2024-12-25 16:01:17 博主文章分类：经验分享 ©著作权

文章标签 人工智能 llama AI私有化部署图形化 docker 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者蚁景网安实验室的原创作品，请联系作者获取转载授权，否则将追究法律责任

前言

AI新时代，提高了生产力且能帮助用户快速解答问题，现在用的比较多的是Openai、Claude，为了保证个人隐私数据，所以尝试本地（Mac M3）搭建Llama模型进行沟通。

Gpt4all

安装比较简单，根据 GitHub - nomic-ai/gpt4all: GPT4All: Run Local LLMs on Any Device. Open-source and available for commercial use. 下载客户端软件即可，打开是这样的：

自己搭建专属AI：Llama大模型私有化部署_图形化

然后选择并下载模型文件，这里以Llama为例：

自己搭建专属AI：Llama大模型私有化部署_docker_02

下载模型文件完，选择模型文件则可以进行对话了：

自己搭建专属AI：Llama大模型私有化部署_人工智能_03

自己搭建专属AI：Llama大模型私有化部署_llama_04

也可以利用基于 nomic-embed-text嵌入模型，把文档转成向量方便语义检索和匹配。选择文档所在的目录：

自己搭建专属AI：Llama大模型私有化部署_docker_05

然后对话中选择对应的文档即可：

自己搭建专属AI：Llama大模型私有化部署_docker_06

如果文件太大，需要在设置适当添加token大小，太大也不好，处理会慢且机器会卡死：

自己搭建专属AI：Llama大模型私有化部署_AI私有化部署_07

自己搭建专属AI：Llama大模型私有化部署_llama_08

gpt4all使用起来还是比较方便的，但是有几个缺点：有些能在huggingface.co搜到的模型在gpt4all上面搜不到、退出应用后聊天记录会消失。

帮助网安学习，全套资料S信免费领取：
① 网安学习成长路径思维导图
② 60+网安经典常用工具包
③ 100+SRC分析报告
④ 150+网安攻防实战技术电子书
⑤ 最权威CISSP 认证考试指南+题库
⑥ 超1800页CTF实战技巧手册
⑦ 最新网安大厂面试题合集（含答案）
⑧ APP客户端安全检测指南（安卓+IOS）

Ollama

安装也很方便，下载 https://ollama.com/download/Ollama-darwin.zip ，然后运行如下命令即可启动Llama：

ollama run llama3.2

自己搭建专属AI：Llama大模型私有化部署_人工智能_09

为了方便图形化使用，可以借助 GitHub - open-webui/open-webui: User-friendly AI Interface (Supports Ollama, OpenAI API, ...) 完整图形化的使用，启动也很简单，直接使用官方仓库中的命令即可：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

然后访问本地的3000端口即可：

自己搭建专属AI：Llama大模型私有化部署_llama_10