零一大模型是否抄袭llama-源码分析带你一探究竟-剪辑-51CTO学堂

零一大模型是否抄袭llama-源码分析带你一探究竟-剪辑

1743未经授权，禁止转载

{{ interaction.likeNum == 0 ? (pageType === 'video' ? '抢首赞' : '点赞') : formatNumber(interaction.likeNum) }} {{ interaction.collectionNum == 0 ? '收藏' : formatNumber(interaction.collectionNum) }} {{ interaction.discussNum == 0 ? (pageType === 'video' ? '抢沙发' : '讨论') : formatNumber(interaction.discussNum) }}

提问 {{ interaction.noteNum > 0 ? interaction.noteNum + '篇笔记' : '记笔记' }} 离线观看

下载学堂APP

缓存视频离线看

报告问题离线观看

下载学堂APP

缓存视频离线看

讨论零一大模型与拉玢模型之间的抄袭争议，分析两者在transformer结构、attention机制、层标准化等方面的相似性。揭示尽管零一大模型未明示借鉴拉玛，但两个模型结构几乎一致，参数配置均源于配置文件，仅在某些如激活函数的代码实现上有所区别。关注更深层次地，如大模型训练平台的构建，对零一大模型是否构成抄袭的判断应更加审慎。此内容适合对深度学习模型、开源社区贡献及抄袭规范感兴趣的技术人员。

讨论{{interaction.discussNum ? '(' + interaction.discussNum + ')' : ''}}

发布

{{ item.user.nick_name }} {{ EROLE_NAME[item.user.identity] }}

置顶笔记

讨论图

{{ item.create_time }}{{ Number(item.like_count) || '' }}回复

删除
是否确认删除?
确认
取消
{{ item.is_top == 1 ? '取消置顶' : '置顶'}}
已有置顶的讨论，是否替换已有的置顶？
确认
取消

{{ tag.text}}

{{ subitem.user.nick_name }}{{ EROLE_NAME[subitem.user.identity] }}

{{ subitem.create_time }}{{ Number(subitem.like_count) || '' }}回复

删除

点击查看更多收起

发布

{{pageType === 'video' ? '讨论区抢占沙发，可获得双倍学分' :'讨论区空空如也，你来讲两句~'}}

发布

{{tips.text}}

{{ noteHeaderTitle }} 笔记{{ hasMyNote ? '我的笔记' : '记笔记' }}

{{ hasMyNote ? '我的笔记' : '记笔记' }}

{{ item.username }}

优质笔记

更新于：{{ $dayjs.formate('YYYY-MM-DD HH:mm:ss', item.last_uptime*1000) }}

{{ detail.username }}

公开笔记对他人可见，有机会被管理员评为“优质笔记”

{{ noteEditor.content.length }}/2000

公开笔记

保存

讲师头像

acedar

世界500强IT企业，7年以上的大型项目开发经验，精通NLP算法及大模型算法及应用，包括RAG及Agent等。电子科技大学硕士，研究领域涵盖人工智能、AIGC、NLP算法，申请专利近30项，曾多次参加公益植树及AI教学等公益活动，优秀共产党员，荣获《2022年度深圳市产业发展与创新人才奖》。精品课程：《AIGC实战：从0到1实现大模型自动生成PPT》《手把手带你从0到1实现大模型agent》《手把手教你实现大模型RAG》《ChatGLM微调原理和源码分析》《ChatGLM原理介绍及源码剖析系列课程》《langchain源码剖析系列课程》等。

接下来播放：

自动连播

DIFY大模型应用实战

DIFY大模型应用实战

大模型应用开发基础（AI大模型全栈系列）

大模型应用开发基础（AI大模型全栈系列）

大白话tensorflow--从此爱上tensorflow

大白话tensorflow--从此爱上tensorflow

L先生智能课堂

AI大模型应用从入门到实战

AI大模型应用从入门到实战

大模型之OneAPI教程:仿OpenAI

大模型之OneAPI教程:仿OpenAI

深度学习MXNet对话机器人原理+源码+操作实战

深度学习MXNet对话机器人原理+源码+操作实战

使用信创算力与虚拟化技术提升大模型部署效率

使用信创算力与虚拟化技术提升大模型部署效率

WOT全球技术大会

智能模型应用：三大开源项目技术详解

智能模型应用：三大开源项目技术详解