AI.x-AIGC专属社区-51CTO.COM
51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
WOT技术大会
IT证书
公众号矩阵
移动端
短视频
免费课程
课程排行
直播课
软考学堂
全部课程
厂商认证
IT技术
25年5月软考
PMP项目管理
免费题库
在线学习
文章
资源
问答
课堂
专栏
直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
AI.x社区
首页
文章
课堂
直播
评选
登录/注册
51CTO
中国优质的IT技术网站
51CTO博客
专业IT技术创作平台
51CTO学堂
IT职业在线教育平台
首页
/
社区头条
社区头条
715
篇优秀内容
2025年02月
腾讯文档也能用上DeepSeek R1满血版了!腾讯已涨超7.5%!实测:丝滑生成哪吒3预测PPT
原创
出品51CTO技术栈(微信号:blog51cto)编辑伊风每天早上醒来,就等着看今天又可以在哪里用上R1了。昨天还在焦急等待微信“AI搜索”的灰度测试,一转眼,腾讯文档直接用上DeepSeek赋能办公了!腾讯文档的动作很快!小程序、网页版AI全屏页、移动端、桌面端全都可以体验R1的赋能。图片网页端体验地址:https:docs.qq.comdesktopopenAiAssistant1&nlc1在之前,腾讯文档已经有了AI文档助手,而这则用R1的推理能力让AI...
51CTO技术栈
11h前
0回复
161浏览
DeepSeek
腾讯
AI
大模型前缀缓存技术,有望将服务成本降低90%
原创
大模型应用程序中的提示词重复率高达70%。前缀缓存机制能够将推理成本降低达90%,显著优化性能并节约资金。是不是总感觉ChatGPT响应缓慢?大家可能没有留意,大模型应用程序的提示词重复率高达70%,问天气、问翻译和问节日安排的内容大量出现,且每次都要消耗算力进行处理。这样的情况在分布式集群的各节点上被无数次放大,白白烧掉宝贵的能源和金钱。为此,Anthropic日前详细介绍了如何利用提示词缓存技术将推理成本降低90%。...
51CTO内容精选
13h前
0回复
194浏览
大模型
ChatGPT
前缀缓存
Grok 3两周内发布,要夺回大模型王座;DeepSeek现象后,AI会改变方向…李彦宏大佬们在迪拜峰会说了啥
原创
2025年世界政府峰会于2月11日在阿联酋迪拜开幕,不少科技大佬都参与了峰会,并表达了自己的真知灼见。在这个关口谈论科技创新,AI无可避免地成为了绝对的主角。马斯克吹捧Grok3将成为有史以来最聪明的AI,“这(指新模型发布之前)可能是其他模型最后一次超过Grok”。而阿里蔡崇信在谈AI竞赛时则说,“下一个发布的模型会比某些模型更好,但不一定比其他的好。总会有其他人推出比你更好的东西。”但大佬们的观点也有共识,技术...
51CTO技术栈
3天前
0回复
334浏览
Grok 3
DeepSeek
AI
综述 DeepSeek R1、LIMO、S1 等 6 篇文章的关键结论
一、背景上一篇文章中我们具体介绍了DeepSeekR1系列模型的构建流程和关键技术点,考虑到最近出现了许多相关工作,也分别得出了各种不同的结论,与此同时还出现了大量的误解。本文中,我们整理了DeepSeekR1等6篇Reasoning相关文章的关键结论,以便相互验证和对比。如下图所示为这些文章中的一些关键指标:相关工作可以参考我们之前的文章:DeepSeekR1论文解读&关键技术点梳理DeepSeekV3详细解读:模型&Infra建...
amei2000go
3天前
0回复
236浏览
DeepSeek R1
LIMO
S1
DeepSeek-R1技术大揭秘:论文核心原理拆解与模型性能突破关键
今天分享DeepSeekR1,Title:DeepSeekR1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning:通过强化学习激励LLM的推理能力。这篇文章介绍了DeepSeek的第一代推理模型DeepSeekR1Zero和DeepSeekR1。DeepSeekR1Zero模型通过大规模强化学习(RL)训练,没有监督微调(SFT)作为初步步骤,展示了RL的潜力及其带来的卓越的推理能力。通过强化学习,DeepSeekR1Zero自然而然地涌现出许多强大而有趣的推理行为。为了进一步优...
arnoldzhw
3天前
0回复
481浏览
DeepSeek
模型
性能
2W8000字深度剖析25种RAG变体:全网最全没有之一
精华
主流RAG框架可以分为以下五个主要的进化方向:成本控制型(适合初创公司)、实时互动型(适用于财经新闻场景)、域专家类型、认知增强型、安全与合规类型。接下来,让我们详细了解一下这25种RAG变体。1.标准RAG一个基本的RAG系统由检索模块和生成模块组成。系统会对查询进行编码,检索相关的文档块,然后为基于transformer的LLM构建丰富的提示。查询编码器:使用预训练的转换器(例如DPR)生成密集的查询嵌入。代码实现如下:fr...
AI论文解读
3天前
0回复
427浏览
RAG
变体
结构化
2025 年最值得关注的五个Agentic代理人工智能框架
原创
01、概述随着2025年的到来,自主智能系统和智能代理(AgenticAI)的发展正在以惊人的速度改变着人工智能的面貌。这些框架不仅简化了AI工作流,还推动了复杂决策和协作能力的实现,为各行各业带来了前所未有的创新机会。那么,在这些迅速崛起的AI框架中,哪些将成为2025年最具变革性的代表?今天,我们将重点介绍五大AgenticAI框架,它们正在引领智能代理领域的未来发展。02、5个重要的AIAgent代理1)MicrosoftAutoGen:重新定义...
Halo咯咯
4天前
0回复
420浏览
人工智能
Agent
Agentic AI框架
Anthropic秘密「混合模型」 Claude 4首曝细节,硬刚GPT-5!深度推理模型来了
精华
Anthropic终于要开始搞点事情啦!近期的「推理模型」热潮中,Anthropic除了其CEO打了几个嘴炮外,还没有掏出一个拿得出手的产品。在这样下去,可能要退出AI一线模型玩家行列了。Anthropic自己显然不想看到这种情况发生。就在刚刚,有消息称,Anthropic会在未来几周内发布其全新的「混合AI」模型。Anthropic版「推理模型」,测试时计算完全掌控在OpenAI去年秋季发布其「推理模型」后,谷歌以及国内众多AI公司纷纷推出了自己的模...
duhorse
3天前
0回复
603浏览
AI
模型
数据
初创公司使用 AI “码农” Devin 一个月的体验
原创
精华
编者按:Devin真的能像人类软件工程师那样工作吗?作为2024年备受瞩目的AIAgent产品,它的实际表现如何?我们今天为大家带来的文章中,作者通过一个月的实际使用体验,发现Devin在处理简单、明确的编程任务时表现不错,但距离达到初级软件工程师的水平还有很长的路要走。文章详细介绍了Devin的使用体验,包括其出色的上手流程设计、与GitHub的便捷集成,以及实时代码审查功能。在处理范围狭窄、定义明确的代码修改时,特别是前...
Baihai_IDP
3天前
0回复
495浏览
LLMs
AI
港大&字节发布领先商用级图像视频生成模型Goku有点东西
文章链接:https:arxiv.orgpdf2502.04896项目链接:https:saiyanworld.github.iogoku亮点直击业界领先的文本生成图像和视频能力,在多个基准测试中创下新纪录。创新性地引入RectifiedFlowTransformer,提高图像视频的联合生成质量。构建大规模高质量数据集,结合MLLM&LLM提高文本描述质量。优化计算效率与训练稳定性,支持大规模分布式训练,实现高效推理。总结速览解决的问题现有的图像与视频生成模型在质量、一致性和计算效率...
angel
4天前
0回复
315浏览
视频生成
训练
AI
一文搞懂 DeepSeek - 强化学习和蒸馏
原创
这个春节,DeepSeek实在太火爆了。DeepSeekR1在其论文(https:arxiv.orgabs2501.12948)引言部分指出,R1模型通过融合冷启动数据、多阶段训练流程以及纯粹的强化学习策略,显著增强了大型语言模型的推理能力。这使得R1模型在性能上与OpenAI的o1系列模型持平,并且通过蒸馏技术,成功地将这种推理能力传递给了更小型化的模型。在DeepSeekR1的“贡献”章节中,着重强调了以下两点创新:1.模型训练完成后:对基础模型实施...
玄姐聊AGI
4天前
0回复
507浏览
DeepSeek
强化学习
蒸馏
低成本+高性能+超灵活!Deepseek 671B + Milvus 重新定义知识库搭建!
原创
这个春节,DeepSeek实在太火爆了。“老板指示,我们要整合Deepseek,还得建立自己的知识库……”这样的声音,哪个开发者近期没耳闻?Deepseek的火爆,智能推理的加速,以及算力成本的显著降低,使得众多原本对大型模型望而却步的企业,一夜之间纷纷投向AI的怀抱,追求降本增效。在这个过程中,对于那些拥有优质私有数据和敏感数据的企业来说,若想避免数据泄露,部署本地知识库无疑是走向大模型的关键一步。然而,当你深入调研...
玄姐聊AGI
4天前
0回复
751浏览
Deepseek
大模型
Milvus
DeepSeek-R1-Zero激发了推理Scaling Law
本文将散落在近期多篇文章中笔者围绕激发推理ScalingLaw的思考做了一下整理。方向MIT对大模型数理原理的强有力证明中总结:基于宏大的人类知识提取出来丰富范畴,形成众多领域的本体知识结构,这是大模型通过预训练已经构建的内部世界模型;提高推理采样的机制,通过训练达成学习推理的scalinglaw,是大模型下一步努力提升的方向。相比传统方法,新的大模型机理,具备更高维度的新颖性、对能力和技术细节的探索,可以通过揭示隐...
ceesoft
4天前
0回复
326浏览
DeepSeek-R1
Scaling Law
模型
一文搞懂 DeepSeek - 强化学习和蒸馏
原创
这个春节,DeepSeek实在太火爆了。DeepSeekR1在其论文(https:arxiv.orgabs2501.12948)引言部分指出,R1模型通过融合冷启动数据、多阶段训练流程以及纯粹的强化学习策略,显著增强了大型语言模型的推理能力。这使得R1模型在性能上与OpenAI的o1系列模型持平,并且通过蒸馏技术,成功地将这种推理能力传递给了更小型化的模型。在DeepSeekR1的“贡献”章节中,着重强调了以下两点创新:1.模型训练完成后:对基础模型实施...
玄姐聊AGI
4天前
0回复
507浏览
DeepSeek
强化学习
蒸馏
港大&字节发布领先商用级图像视频生成模型Goku有点东西
文章链接:https:arxiv.orgpdf2502.04896项目链接:https:saiyanworld.github.iogoku亮点直击业界领先的文本生成图像和视频能力,在多个基准测试中创下新纪录。创新性地引入RectifiedFlowTransformer,提高图像视频的联合生成质量。构建大规模高质量数据集,结合MLLM&LLM提高文本描述质量。优化计算效率与训练稳定性,支持大规模分布式训练,实现高效推理。总结速览解决的问题现有的图像与视频生成模型在质量、一致性和计算效率...
angel
4天前
0回复
315浏览
视频生成
训练
AI
颠覆传统搜索方式!向量相似性与图数据库的强强联合
原创
精华
01、概述在传统的数据库搜索中,我们更像是在翻阅一份电话簿——你可以查找“拥有红色头发的人”或“谁的车是蓝色的”。但问题是,这种方式虽然高效,却非常局限。如今,向量相似性搜索(VectorSimilaritySearch)改变了游戏规则,它不再仅仅依赖关键词,而是让我们可以问:“哪些东西与这个最相似?”——它能够挖掘语义上的相似性,找到那些隐藏的联系。但仅仅找到相似的事物还不够。现实世界的复杂性不仅仅是单个数据点的问...
Halo咯咯
5天前
0回复
544浏览
人工智能
AI
图数据库
从国内外十个智能体案例,看AI Agent在教育领域的应用
经历了一年多的发展,AIAgent正在越来越多地参与到教育工作之中。TobyHudson构建了一个Agent用于支持他的化学基础单元的学生。这个Agent以教育公平为目标,有助于缩小专业学生与以前没有学习过化学的学生的学习差距。这个Agent还能帮助学生广泛理解基本概念,指示学生提问以检查他们的理解情况,并估计他们的知识水平。JoanneHinitt正在构建一个AIAgent,以帮助她的学生学习如何构建措辞合理的职业治疗目标,这些目标对临床环境...
王吉伟自频道
5天前
0回复
1761浏览
智能体
AI
Agent
DeepSeek并非完美,训练过程存在“深度诅咒”
精华
高性能大模型在训练的过程中通常需要数千个GPU,耗费数月甚至更长时间才能完成一次训练。这种巨大的资源投入使得模型的每一层都必须高效训练,才能确保算力资源最大化利用。但大连理工、西湖大学、牛津大学等研究人员对DeepSeek、Qwen、Llama和Mistral研究发现,这些模型的深层在训练过程中表现并不好,甚至可以被完全剪枝而不会影响模型性能。例如,研究人员对DeepSeek7B模型进行了逐层剪枝,以评估每一层对模型整体性能的贡献...
Aceryt
5天前
0回复
627浏览
DeepSeek
模型
LayerNorm
Unsloth:仅需7GB显存就能训练自己的DeepSeek-R1!
随着LLM应用的广泛普及,如何提高模型的推理效率并降低资源消耗成为了技术发展中的一大挑战。Unsloth通过引入多个强化学习(RL)算法和最新的量化技术,显著提高了LLM在推理和微调过程中的性能,并大幅降低了显存消耗。DeepSeek的研究人员在用纯强化学习(RL)训练R1Zero时观察到了一个“灵光一现”的时刻。模型学会了通过重新评估最初的思路来延长思考时间,而无需任何人工指导或预定义指令。Unsloth对整个GRPO过程进行了增强...
PyTorch研习社
6天前
0回复
679浏览
Unsloth
DeepSeek-R1
显存
一个强大的集成学习算法:梯度提升树!
一、算法介绍梯度提升树(GradientBoostingTrees,GBT)是一种强大的集成学习方法,它通过迭代地添加弱预测模型来构建一个强预测模型。在每一轮迭代中,新的模型会试图纠正前序模型产生的错误。GBT可以用于回归和分类问题,并且在许多实际应用中表现优异。二、算法原理三、案例分析为了展示梯度提升树的实际应用,我们将使用提供的数据集来预测机器是否会发生故障。首先加载数据,并进行必要的预处理。3.1数据预处理与模型建立im...
宝宝数模AI
7天前
0回复
289浏览
学习算法
梯度
提升树
1
2
3
4
5
6
7
8
9
10
36
客服