xuxiangda的主页-AI.x-AIGC专属社区-51CTO.COM

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

xuxiangda

LV.5

这个用户很懒，还没有个人简介

帖子 81

声望 832

关注 0

粉丝 0

社区头条作者热门内容榜上榜作者

私信

关注

主帖 81

回帖

图神经网络崛起，Transformer助力无人机组团“开挂”！多智能体协作技术再突破！

精华

热门内容榜 • TOP7

在多智能体系统中的协作算法中，传统的路径规划方法，例如旅行商问题求解器、粒子群优化算法和贪婪搜索策略，通常能够在静态或已知环境中表现出色。当环境充满不确定性且任务目标分布未知时，这些方法的局限性显露无遗。传统强化学习方法虽然能够在部分可观测环境中进行学习，但在多智能体场景中却常常难以协调智能体之间的行为，导致效率低下。问题的核心在于这些传统方法缺乏对智能体之间复杂关系的有效建模能力，同时也很难...

4天前 708浏览 0点赞 0回复 0收藏

超级代理来袭！混合AI路由器联动云边技术，TensorOpera 解密智能体从意图识别到复杂规划

人工智能日新月异，大模型（LLM）的快速发展正以前所未有的速度重塑我们的工具箱，为各种智能应用注入全新活力。如今LLM不仅能实现自然语言生成和语义理解，更成为推动AI代理系统进步的重要引擎。越来越多的应用证明，仅凭传统静态模型已难以满足不断变化的任务需求，而具备更强适应性的智能代理正成为未来的趋势。正因如此，构建一套能够无缝应对多种任务、具备高度协同和灵活响应能力的“超级代理系统”显得尤为迫切。这样的...

4天前 466浏览 0点赞 0回复 0收藏

人工智能与人性关怀碰撞，AI 的心理健康服务是未来蓝图

心理健康问题正日益成为全球性挑战。它不仅影响个人的幸福感和生活质量，还对社会的可持续发展构成潜在威胁。全球范围内，每八个人中就有一人深受心理健康问题的困扰，而这一比例在现代社会的压力下还在逐渐上升。尽管公众对心理健康的重视有所增加，心理支持服务的可及性却仍然受到限制，尤其是对处于弱势群体中的人来说，专业资源更是稀缺。这种供需之间的矛盾催促人们寻找创新且可扩展的解决方案，以填补传统心理健康服务所...

2025-04-08 07:23:06 1097浏览 0点赞 0回复 0收藏

《基础代理的进步与挑战，从大脑启发智能到进化、协作和安全系统》第一部分：智能代理的核心组件

人工智能领域正迎来一场从被动工具到主动智能的革命，而这一趋势的核心推手便是基础代理（FoundationAgents）的崛起。基础代理不仅是现有大语言模型（LLMs）和多模态模型（LMMs）的延续，更是迈向类人智能系统的重要里程碑。它们以强大的感知、决策和执行能力，试图在认知和行动中复制甚至超越人类智能。这一切离不开脑启发智能（BrainInspiredIntelligence）的重要推动。研究人员从人类认知体系中汲取灵感，模拟大脑在感知、记...

2025-04-08 07:12:16 797浏览 0点赞 0回复 0收藏

从FP8到安全张量，DeepSeek‑V3‑0324 重塑大模型生态的秘密武器

精华

3月24日，DeepSeek‑V3‑0324闪亮登场。这款模型以其创新的架构和性能突破，迅速吸引了全球开发者的目光。根据VentureBeat的报道，DeepSeek‑V3‑0324在消费级硬件（如MacStudio）上实现了每秒20个token的推理速率，这一表现虽然尚未达到顶尖水平，但其能够在非数据中心环境中运行的能力，标志着大模型应用的一次重要转折。同时，DeepSeek‑V3‑0324的开源策略也为开发者提供了前所未有的自由，允许商业化使用并支持模型的二次...

2025-03-26 07:58:28 1266浏览 0点赞 0回复 0收藏

记忆牢笼还是概括之路？上海交通大学与加州大学圣地亚哥分校联合团队破解大模型代码生成谜题

在充满挑战与机遇的人工智能领域，大语言模型（LargeLanguageModels,LLMs）已经在多个场景中展现了惊人的潜力。从语言生成到机器翻译，这些模型不断突破界限。而在软件开发这一专业化领域，它们似乎成为了一种理想的助手——帮助程序员从自然语言描述中生成代码，或通过提示优化现有程序。然而，尽管模型的能力令人惊叹，它们也面临着不可忽视的问题：是否能真正理解编程逻辑，还是仅仅在“记住”和“复述”？来自上海交通大学...

2025-03-14 00:16:28 1332浏览 0点赞 0回复 0收藏

工作流代理新突破：FlowAgent的合规性与灵活性解析

社区头条

在对话系统研究领域，工作流代理的设计与实现始终充满了挑战与机遇。传统的任务导向对话系统（TOD）通常采用模块化流水线架构，将自然语言理解（NLU）、对话状态跟踪（DST）以及自然语言生成（NLG）功能分离开来。但是这种方法由于误差传播问题，效率往往不高。随着大型语言模型（LLMs）的兴起，基于LLMs的端到端对话系统逐渐成为主流，通过工作流引导的互动进行整体对话管理，显著提高了任务成功率。对话系统从模块化流水线到...

2025-03-04 09:46:17 1728浏览 0点赞 0回复 0收藏

人工智能驱动的科学研究创新，迈向AI协同科学家

在现代科学研究过程中，科学家们面临着许多挑战，假设生成和实验验证的复杂性使得研究进程变得相当缓慢，科学发现依赖于科学家提出新颖的假设，并通过严格的实验验证这些假设。但是生成具有原创性且可验证的研究假设往往需要耗费大量的时间和资源。随着科学领域的不断扩展，科学家们需要在更广泛的知识背景下进行研究，这进一步增加了难度。同时，科学研究中多学科交叉和大规模数据的处理也带来了新的挑战。现代科学问题往往涉...

2025-03-04 09:39:30 1482浏览 0点赞 0回复 0收藏

当爱情遇上算法，人工智能将永远爱你吗？研究浪漫AI伴侣的隐性偏见

AI陪伴者作为一种新兴的数字技术现象，逐渐进入我们的生活，从简单的数字助手到情感陪伴者，其应用范围越来越广泛。数字助手如AmazonAlexa和Siri，早已成为许多家庭中的一部分，而更具人性化的情感陪伴者，如Replika等AI聊天机器人，更是在全球范围内吸引了数百万用户。这些AI系统不仅能够完成基本的任务，还能够与用户进行复杂的对话，甚至在一定程度上参与到情感交流中。但是随着人与AI互动的深入，一些隐性偏见问题逐渐浮现...

2025-03-04 09:32:03 1806浏览 0点赞 0回复 0收藏

大模型在零样本面部情绪标注中的突破与应用

精华

情绪识别作为人机交互中的关键一环，能够提升智能系统的反应灵敏度和人性化程度。但是传统的情绪标注方法面临着诸多挑战和局限性，人工情绪标注过程既耗时又昂贵，并且标注员可能会因个人主观性带来不同的评估标准，从而影响标注的一致性和准确性。人工标注不仅成本高且效率低下，标注员需要长时间精心标注数据，这不但要求大量人力资源，还会引入人类认知中的固有变异性和潜在偏见。情绪标注任务的主观性和细微差别增加了标注...

2025-02-21 12:13:56 2108浏览 0点赞 0回复 0收藏

斯坦福大学团队使用多智能体强化学习训练社交推理语言模型

社交推理游戏是一类需要玩家通过交流和推理来达成目标的游戏，典型的例子是我们熟悉的《狼人杀》，这些游戏要求玩家在有限的信息下，通过与其他玩家的交流和互动，推断出某个隐藏角色的身份。假如让多智能体玩狼人杀，这些智能体可以合作、竞争或者两者兼而有之。研究多智能体环境不仅有助于理解智能体之间的互动，还能为开发更智能、更协调的系统提供理论基础。在多智能体环境中，使用自然语言进行交流是一种强大的工具。它不...

2025-02-14 12:31:07 1757浏览 0点赞 0回复 0收藏

从《你所需要的就是注意力》到《你所需要的就是多头潜在注意力》，TransMLA开启AI技术新篇章

自2017年谷歌提出了Transformer架构，以及那篇著名的论文《AttentionIsAllYouNeed》后，注意力机制迅速成为自然语言处理领域的核心技术。大型语言模型（LLMs）借助Transformer的自注意力机制，实现了对复杂语言模式的捕捉，在机器翻译、文本生成、对话系统等领域取得了革命性的突破。它们不仅改变了学术研究的方向，更深刻地影响了生产力工具的发展，提高了人们的工作效率和生活质量。随着模型规模和数据量的不断增长，LLMs面临...

2025-02-14 12:19:15 1798浏览 0点赞 0回复 0收藏

一文读懂 DeepSeek-V3 技术报告

社区头条

‌2023年7月17日，DeepSeek正式成立，由幻方量化提供资金支持。梁文锋凭借其在金融和AI领域的深厚背景，带领团队开始探索生成式AI技术。同年11月2日，DeepSeek推出首款开源模型DeepSeekCoder，支持多种编程语言的代码生成、调试和数据分析任务，为AI领域的应用奠定了基础，直到2024年12月，DeepSeekV3的发布引发了行业震动和社会广泛关注，在他们的最新技术报告《DeepSeekV3技术报告》中，团队详细介绍了其最新成果——DeepSeek...

2025-02-05 18:07:36 4239浏览 0点赞 0回复 0收藏

华为诺亚方舟实验室突破具身AI瓶颈， SpatialCoT通过坐标对齐和思路链推进空间推理

具身人工智能的目标是使机器人或虚拟代理能够像人类一样理解和操作其所在的物理环境，而空间推理被视为实现具身任务规划的关键能力。导航和操作任务是具身AI中常见的挑战，依赖于模型对空间关系的理解和高效执行复杂任务的能力，但现有方法在处理复杂空间推理任务时仍面临诸多局限，难以满足实际应用的需求。现有方法大多通过补充空间数据和模型微调来提升空间推理能力，可是这些方法主要依赖于语言生成的粗粒度结果，难以在复...

2025-01-21 14:11:14 2345浏览 0点赞 0回复 0收藏

艾伦图灵研究所最新成果：多智能体博弈中的可纠正性和一致性

精华

多智能体系统研发正在快速发展，过去一年我们曾分析41篇研究多智能体的论文，说明自主代理系统的研究正逐渐成为一个炙手可热的话题。为了使这些系统能够与人类用户和其他系统有效互动，确保其行为的可纠正性（corrigibility）和一致性（alignment）是至关重要的。1月11日，arXiv发表的艾伦图灵研究所的最新成果《OnCorrigibilityandAlignmentinMultiAgentGames》，这篇论文聚焦于多代理环境中的自主代理的可纠正性问题，并提出...

2025-01-13 10:12:30 2528浏览 0点赞 0回复 0收藏

阿里巴巴语音实验室发布新成果，多模态方法显著提升视频主题分割性能

随着数字视频内容的爆炸式增长，如何有效地进行视频主题分割成为了一个亟待解决的问题。视频主题分割的目标是将视频内容按主题进行划分，以便更好地理解和管理视频信息。这不仅在视频检索和推荐系统中起到关键作用，还能提升视频编辑和生成摘要的效率。在教育和娱乐领域，视频主题分割同样能够极大地促进内容分类和个性化推荐。在视频内容分析领域，多模态数据的融合和一致性建模是当前的研究热点。多模态数据包括视频中的视觉...

2025-01-02 13:41:16 1960浏览 0点赞 0回复 0收藏

中国科学院软件研究所联合团队通过反事实推理解锁多智能体系统中的智能体行为

一年多以来，强化学习（RL）在许多重要的顺序决策问题上取得了惊人的进展，随着问题的复杂性不断增加，研究领域也逐渐从单智能体强化学习算法转向多智能体强化学习（MARL）算法，这些算法在各种领域中发挥着越来越重要的作用，如无人驾驶飞机、工业机器人、相机网络和自动驾驶等。但是深度RL策略通常缺乏可解释性，使得人类很难理解和信任这些策略。在多智能体系统（MAS）中，由于智能体之间的交互和依赖性，这一问题更为突出。...

2024-12-24 13:55:05 2377浏览 0点赞 0回复 0收藏

我们一起聊聊基于快速傅里叶卷积（FFC）的故障诊断模型

本期推出一种基于快速傅里叶卷积的FFCResNet的网络模型，通过把ResNet中常规卷积替换为快速傅里叶卷积，提升了卷积神经网络（CNN）的性能，并应用在轴承故障诊断任务上，取得了不错的效果！通过巧妙融合快速傅里叶变换（FFT）的卓越性能，快速傅里叶卷积（FFC）成为了执行卷积操作的高效利器，尤其是在渴求全局性上下文理解与跨尺度特征无缝融合的场景下展现出了非凡优势。这种创新性的频域处理手段，不仅显著提升了特征提取的...

2024-12-16 11:04:20 2073浏览 0点赞 0回复 0收藏

DeepSeek-VL2开源，VLM迈入MoE时代！

DeepSeekVL2：一个先进的大型混合专家（MoE）视觉语言模型系列，它显著改进了其前身DeepSeekVL。DeepSeekVL2在多种任务上展现出卓越的能力，包括视觉问题回答、光学字符识别、文档表格图表理解以及视觉定位。图片包括三个变体：DeepSeekVL2Tiny、DeepSeekVL2Small和DeepSeekVL2，分别拥有10亿、28亿和45亿激活参数。与现有的开源密集型和基于MoE的模型相比，DeepSeekVL2在相似或更少的激活参数下实现了竞争性或最先进的性能。...

2024-12-16 10:44:12 2791浏览 0点赞 0回复 0收藏

从数据集到模型：视频和音频情绪分析的综合研究

情绪分析作为自然语言处理和人工智能领域的重要研究方向，近年来受到了广泛关注。情绪分析技术能够自动识别和理解文本、音频、视频等多种数据中的情绪信息，在社交媒体监控、客户服务、心理健康评估等多个领域具有重要应用价值。例如，通过情绪分析，企业可以更好地了解客户反馈，改进产品和服务；心理健康专家可以通过分析患者的情绪变化，提供更精确的诊断和治疗建议。然而，单一模态的情绪分析（如纯文本或纯音频）存在一定...

2024-12-16 10:24:04 3257浏览 0点赞 0回复 0收藏

获得成就

已积累 4.9w 人气

获得 1 个点赞

获得 0 次收藏