社交推理游戏是一类需要玩家通过交流和推理来达成目标的游戏,典型的例子是我们熟悉的《狼人杀》,这些游戏要求玩家在有限的信息下,通过与其他玩家的交流和互动,推断出某个隐藏角色的身份。假如让多智能体玩狼人杀,这些智能体可以合作、竞争或者两者兼而有之。研究多智能体环境不仅有助于理解智能体之间的互动,还能为开发更智能、更协调的系统提供理论基础。在多智能体环境中,使用自然语言进行交流是一种强大的工具。它不...
自2017年谷歌提出了Transformer架构,以及那篇著名的论文《AttentionIsAllYouNeed》后,注意力机制迅速成为自然语言处理领域的核心技术。大型语言模型(LLMs)借助Transformer的自注意力机制,实现了对复杂语言模式的捕捉,在机器翻译、文本生成、对话系统等领域取得了革命性的突破。它们不仅改变了学术研究的方向,更深刻地影响了生产力工具的发展,提高了人们的工作效率和生活质量。随着模型规模和数据量的不断增长,LLMs面临...
2023年7月17日,DeepSeek正式成立,由幻方量化提供资金支持。梁文锋凭借其在金融和AI领域的深厚背景,带领团队开始探索生成式AI技术。同年11月2日,DeepSeek推出首款开源模型DeepSeekCoder,支持多种编程语言的代码生成、调试和数据分析任务,为AI领域的应用奠定了基础,直到2024年12月,DeepSeekV3的发布引发了行业震动和社会广泛关注,在他们的最新技术报告《DeepSeekV3技术报告》中,团队详细介绍了其最新成果——DeepSeek...
2025-02-05 18:07:36 1564浏览 0点赞 0回复 0收藏
具身人工智能的目标是使机器人或虚拟代理能够像人类一样理解和操作其所在的物理环境,而空间推理被视为实现具身任务规划的关键能力。导航和操作任务是具身AI中常见的挑战,依赖于模型对空间关系的理解和高效执行复杂任务的能力,但现有方法在处理复杂空间推理任务时仍面临诸多局限,难以满足实际应用的需求。现有方法大多通过补充空间数据和模型微调来提升空间推理能力,可是这些方法主要依赖于语言生成的粗粒度结果,难以在复...
2025-01-21 14:11:14 489浏览 0点赞 0回复 0收藏
多智能体系统研发正在快速发展,过去一年我们曾分析41篇研究多智能体的论文,说明自主代理系统的研究正逐渐成为一个炙手可热的话题。为了使这些系统能够与人类用户和其他系统有效互动,确保其行为的可纠正性(corrigibility)和一致性(alignment)是至关重要的。1月11日,arXiv发表的艾伦图灵研究所的最新成果《OnCorrigibilityandAlignmentinMultiAgentGames》,这篇论文聚焦于多代理环境中的自主代理的可纠正性问题,并提出...
2025-01-13 10:12:30 1052浏览 0点赞 0回复 0收藏
随着数字视频内容的爆炸式增长,如何有效地进行视频主题分割成为了一个亟待解决的问题。视频主题分割的目标是将视频内容按主题进行划分,以便更好地理解和管理视频信息。这不仅在视频检索和推荐系统中起到关键作用,还能提升视频编辑和生成摘要的效率。在教育和娱乐领域,视频主题分割同样能够极大地促进内容分类和个性化推荐。在视频内容分析领域,多模态数据的融合和一致性建模是当前的研究热点。多模态数据包括视频中的视觉...
2025-01-02 13:41:16 397浏览 0点赞 0回复 0收藏
一年多以来,强化学习(RL)在许多重要的顺序决策问题上取得了惊人的进展,随着问题的复杂性不断增加,研究领域也逐渐从单智能体强化学习算法转向多智能体强化学习(MARL)算法,这些算法在各种领域中发挥着越来越重要的作用,如无人驾驶飞机、工业机器人、相机网络和自动驾驶等。但是深度RL策略通常缺乏可解释性,使得人类很难理解和信任这些策略。在多智能体系统(MAS)中,由于智能体之间的交互和依赖性,这一问题更为突出。...
2024-12-24 13:55:05 711浏览 0点赞 0回复 0收藏
本期推出一种基于快速傅里叶卷积的FFCResNet的网络模型,通过把ResNet中常规卷积替换为快速傅里叶卷积,提升了卷积神经网络(CNN)的性能,并应用在轴承故障诊断任务上,取得了不错的效果!通过巧妙融合快速傅里叶变换(FFT)的卓越性能,快速傅里叶卷积(FFC)成为了执行卷积操作的高效利器,尤其是在渴求全局性上下文理解与跨尺度特征无缝融合的场景下展现出了非凡优势。这种创新性的频域处理手段,不仅显著提升了特征提取的...
2024-12-16 11:04:20 570浏览 0点赞 0回复 0收藏
DeepSeekVL2:一个先进的大型混合专家(MoE)视觉语言模型系列,它显著改进了其前身DeepSeekVL。DeepSeekVL2在多种任务上展现出卓越的能力,包括视觉问题回答、光学字符识别、文档表格图表理解以及视觉定位。图片包括三个变体:DeepSeekVL2Tiny、DeepSeekVL2Small和DeepSeekVL2,分别拥有10亿、28亿和45亿激活参数。与现有的开源密集型和基于MoE的模型相比,DeepSeekVL2在相似或更少的激活参数下实现了竞争性或最先进的性能。...
2024-12-16 10:44:12 1018浏览 0点赞 0回复 0收藏
情绪分析作为自然语言处理和人工智能领域的重要研究方向,近年来受到了广泛关注。情绪分析技术能够自动识别和理解文本、音频、视频等多种数据中的情绪信息,在社交媒体监控、客户服务、心理健康评估等多个领域具有重要应用价值。例如,通过情绪分析,企业可以更好地了解客户反馈,改进产品和服务;心理健康专家可以通过分析患者的情绪变化,提供更精确的诊断和治疗建议。然而,单一模态的情绪分析(如纯文本或纯音频)存在一定...
2024-12-16 10:24:04 919浏览 0点赞 0回复 0收藏
离线多智能体强化学习(MARL)是一个新兴领域,目标是在从预先收集的数据集中学习最佳的多智能体策略。相比于单智能体情况,多智能体环境涉及到大规模的联合状态动作空间和多智能体间的耦合行为,这给离线策略优化带来了额外的复杂性。随着人工智能技术的发展,多智能体系统在诸如自动驾驶、智能家居和机器人协作等方面展现了巨大的应用潜力。但是离线MARL较单智能体情况下更加复杂,其涉及庞大的联合状态动作空间和多智能体间...
2024-12-12 10:41:36 777浏览 0点赞 0回复 0收藏
智能体故障对多智能体强化学习(MARL)算法的性能构成了显著威胁,主要带来两大挑战。智能体常常难以从由意外故障引发的混乱状态空间中提取关键信息。其次回放缓冲区中记录的故障前后转变不均衡,导致训练样本失衡问题。为了解决这些问题,来自清华大学自动化系和QiYuanLab(启源实验室)的联合团队通过结合优化的模型架构和定制的训练数据采样策略来增强MARL的故障容错能力。具体而言,研究团队在actor和critic网络中引入了注...
2024-12-04 12:15:04 1076浏览 0点赞 0回复 0收藏
在2023年,检索增强型生成(RAG)技术占据了主导地位,而在2024年,智能体工作流程正在推动巨大的进步。使用AI智能体为构建更强大的、健壮的、多功能的大型语言模型(LLM)驱动的应用开辟了新的可能性。其中一个可能性是在智能体RAG流程中增强RAG流程中的AI智能体。智能体RAG的基础知识什么是检索增强型生成(RAG)检索增强型生成(RAG)是一种构建LLM驱动应用的技术。它利用外部知识源为LLM提供相关上下文,减少幻觉现象。一个...
2024-11-26 15:30:21 924浏览 0点赞 0回复 0收藏
随着自动驾驶技术的快速发展,人们对于自主车辆的期待也在不断提高。然而,尽管现有的技术已经能够实现车辆在高速公路上的自动驾驶,以及无人驾驶出租车在主要城市开始运营,技术上所谓的“L5”全自动驾驶仍未完全实现。实现这一目标需要解决多个技术难题,其中之一便是提供能够在高速公路匝道入口安全、可靠运行的全自动控制功能。现阶段的自动驾驶技术虽然取得了显著进展,但仍面临许多挑战。社会普遍认为自动驾驶汽车需要比...
2024-11-26 15:19:48 1405浏览 0点赞 0回复 0收藏
集体智慧(CollectiveIntelligence,CI)在许多领域都扮演着至关重要的角色。无论是在经济学、进化理论,还是在神经网络和社会性昆虫的研究中,集体智慧都展现出了其广泛的应用前景。在经济学中,市场行为往往可以被视为一种集体智慧的表现,个体的决策汇聚成市场的集体行为,这种现象在信息传播、价格形成等方面尤为明显。在进化理论中,集体智慧则体现在物种的协同进化过程中,例如蚂蚁和蜜蜂的群体行为,这些社会性昆虫通过...
2024-11-19 14:47:15 1406浏览 0点赞 0回复 0收藏
大模型在许多任务上表现优异,但是它们在社交情境中的判断能力仍是一个亟待解答的问题。社会情境判断不仅涉及对情境的理解,还包括适应和回应他人行为的能力。11月10日《自然》科学报告子刊发布文章《Largelanguagemodelscanoutperformhumansinsocialsituationaljudgments》,研究的目的正是为了探讨LLM能否在这方面与人类匹敌甚至超越人类。这项研究通过情境判断测试(SJT)对多款聊天机器人的表现进行了评估,并将其与人类参...
2024-11-13 14:49:51 694浏览 0点赞 0回复 0收藏
人工智能代理(智能体)已经单独或在小组内进行了评估,其中交互的范围和复杂性仍然有限。涉及许多自主主体的大规模模拟——反映了整个文明过程——尚未得到探索。Altera.AL是一家专注于创建数字人类的研究公司,他们的使命是创建能够与我们共生、成长的数字人类。这家公司集结了来自MIT、斯坦福、谷歌X和Citadel等顶级机构的计算神经科学家、计算机科学家和工程师,旨在推动这一前沿研究。他们的使命不仅仅是设计出智能代理,...
2024-11-06 14:28:52 1059浏览 0点赞 0回复 0收藏
让智能体在不断变化的环境中动态适应、并有效合作是一个巨大的挑战,特别是当智能体需要与陌生的智能体互动时,传统训练方法往往表现不佳。这种情况下,引入逆向注意力智能体(InverseAttentionAgents)成为了一种创新且有效的解决方案。逆向注意力智能体的核心在于借鉴“心智理论”(TheoryofMind,ToM),通过注意力机制来推断其他智能体的目标和行为,并据此调整自己的行动。这种方法不仅能够提升智能体在合作任务中的表现,...
2024-10-31 14:44:08 774浏览 0点赞 0回复 0收藏
在人类的合作中,我们可能会遇到囚徒困境(SocialDilemmas)、悲剧的共有(TragedyoftheCommons)、公平分配问题(PublicGoodsGame)、猎人与收集者困境(StagHuntGame)、和合作网络(NetworkedCooperation)等诸多社会性合作困境,比如两个人必须决定是否与对方合作(相互协力)或是背叛(选择个人利益)。合作可以带来最大的集体收益,但个体背叛可能会导致更高的个人收益。这种情况下,我们需要在短期的个人利益和长期的集...
2024-10-28 15:14:42 837浏览 0点赞 0回复 0收藏
多模态大语言模型(MLLMs)的发展迅速,成为了人工智能研究的一个关键领域。这些模型不仅能够处理文本,还能够理解并生成视觉信息,使其在许多应用中展现出卓越的潜力。尽管在某些领域取得了显著进展,但在复杂的视觉和数学推理任务上,MLLMs的表现仍有待提高。为此,来自亚马逊、微软、谷歌DeepMind联合研究团队开发了POLYMATH,这是一个具有挑战性的基准,旨在系统地分析和评估这些模型在视觉复杂场景下的数学推理能力。通过5...
2024-10-23 11:42:52 864浏览 0点赞 0回复 0收藏