遇见数据集-让每个数据集都被发现,让每一次遇见都有价值。
2025-02-25,由布朗大学和德州大学达拉斯分校联合创建了V-HOP数据集,目的通过结合视觉和触觉信息实现鲁棒的6D物体姿态跟踪。该数据集的最大特点是包含了多种机械手和物体的多模态数据,能够有效支持跨机械手和跨物体的泛化能力,为机器人在复杂环境下的精准操作提供了更强大的感知支持。
2025-02-22,阿里巴巴集团菜鸟自动驾驶实验室和百度研究院共同创建了一个名为 Para-Lane 的真实世界多车道数据集。该数据集目的评估自动驾驶系统中的新型视角合成(NVS)能力,通过提供大量真实世界的数据,弥补了现有合成数据集在真实性方面的不足,为自动驾驶技术的发展和仿真提供了重要支持。
2025-02-09 ,由CUHK MMLab、CUHK MulLab、字节跳动、、东北大学等机构联合发布MME-CoT数据集,该数据集目的评估大型
2025-02-07, 由斯坦福大学、华盛顿大学等研究机构创建了 s1K 数据集,该数据集包含 1,000 个精心挑选的问题,并配以推理轨迹和数据基础。
本文针对Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI 中的49个数据集进行完整下载地址整理收集。 2024年8月26日,由刘洋、陈伟星、白永杰、梁晓丹、李冠斌、高文、林亮等作者编写,深入探讨了具身智能AI。 具身人工智能的关键技术: 具身感知、具身交互、具身智能体、模拟到真实世界迁移。 具身感知主要涉及:主动视觉感知、三维视觉定位、视觉语言导航、非视觉感知:触觉 一、具身感知中 (22个) 1、视觉语言导航 的12个数据集 2、非视觉感知:触觉 的10个数据集 二、具身交互 (19个) 1、具身问答 的10个数据集 2、具身抓取的 9个数据集 三、论文中其他数据集等(8个)
2024-02-28,由杨刘、曹家欢、刘崇宇、丁凯、金连文等作者编写,深入探讨了大型语言模型数据集,这些数据集在大语言
2025-02-07, 由斯坦福大学、华盛顿大学等研究机构创建了 s1K 数据集,该数据集包含 1,000 个精心挑选的问题,并配以推理轨迹和答案,为语言模型推理能力的提升提供了重要的数据基础。
2025-02-09 ,由CUHK MMLab、CUHK MulLab、字节跳动、、东北大学等机构联合发布MME-CoT数据集,该数据集目的评估大型多模态模型(LMMs)中的思维链(CoT)推理能力,涵盖数学、科学、OCR、逻辑、时空和通用场景六个领域,通过细致的评估指标体系,深入分析了当前LMMs在推理质量、鲁棒性和效率方面的表现,为多模态推理研究提供了重要的参考和指导。
2025年1月7号,由杨德杰、赵子敬、刘洋联合提出PlanLLM,一种基于可微调大型语言模型(LLM)的跨模态联合学习框架
2024年2月28日,由多位作者联合提出了一种名为可靠冲突性多视角学习(RCML)的框架,其核心贡献在于为含有冲突性实例的多视角数据
2024-02-02,由刘超、赵婷、郑能干一起提出了一种名为DeepBranchTracer的新型方法,是一种高效、通用的曲线结
2024-02-28,由杨刘、曹家欢、刘崇宇、丁凯、金连文等作者编写,深入探讨了大型语言模型数据集,这些数据集在大语言模型中取得的显著进步中发挥着至关重要的作用。调查从五个方面对LLM的 444个 数据集进行了整理和分类。
2024-02-02,由刘超、赵婷、郑能干一起提出了一种名为DeepBranchTracer的新型方法,是一种高效、通用的曲线结构重建方法,适用于多种 2D 和 3D 图像数据集。通过结合图像特征和几何特征,显著提高了重建的准确性和连续性。
2025年1月7号,由杨德杰、赵子敬、刘洋联合提出PlanLLM,一种基于可微调大型语言模型(LLM)的跨模态联合学习框架,用于解决视频程序规划任务。通过引入LLM增强规划模块和互信息最大化模块,PlanLLM突破了现有方法依赖封闭集标签和固定语义描述的限制,实现了对新步骤和任务的泛化能力。该方法在COIN、CrossTask、NIV三个基准数据集上取得显著性能提升,展现了其在弱监督学习中的有效性。
2024年2月28日,由多位作者联合提出了一种名为可靠冲突性多视角学习(RCML)的框架,其核心贡献在于为含有冲突性实例的多视角数据提供决策结果与可靠性评估。该方法通过证据驱动的多视角融合(ECML)策略,在6个公开数据集上验证了其在准确性、可靠性和鲁棒性上的优势。
2025-01-02,由北京航空航天大学的研究团队创建了数据集Git-10M,这是一个包含1000万图像-文本对的全球规模遥感数据集。该数据集为文本驱动的遥感图像生成技术提供了强大的基础,显著提升了生成图像的多样性和质量,推动了遥感图像生成技术的发展。
2023-09-18 ,加州大学洛杉矶分校(UCLA)、微软研究院、斯坦福大学等机构共同创建的新型基础设施,目的在评估大型语言模型在游戏互动中的规划和协调能力。MindAgent通过CuisineWorld这一新的游戏场景和相关基准,调度多智能体协作效率,并监督多个智能体同时玩游戏。一、研究背景大型语言模型(LLMs)在处理复杂任务方面展现出巨大潜力,从数学推理到专业领域的问答,LLMs的应用范围
2025-01-15,由北航大学、合肥工业大学、中科院信息工程研究所和美团等机构联合创建介绍了一种名为LLaVA-ST的多模态大型
2025-01-15,由北航大学、合肥工业大学、中科院信息工程研究所和美团等机构联合创建介绍了一种名为LLaVA-ST的多模态大型语言模型。该模型配备了一个名为ST-Align的数据集,包含430万训练样本,专为细粒度时空多模态理解设计。
2023-09-18 ,加州大学洛杉矶分校(UCLA)、微软研究院、斯坦福大学等机构共同创建的新型基础设施,目的在评估大型语言模型在游戏互动中的规划和协调能力。MindAgent通过CuisineWorld这一新的游戏场景和相关基准,调度多智能体协作效率,并监督多个智能体同时玩游戏。
本文针对《LLMBook》https://llmbook-zh.github.io/ 中的56个数据集进行完整下载地址整理收集。
根据遇见数据集平台监测数据分析,截止2024年12月底,数据交易市场总披露交易金额突破550亿元,总挂牌数据产品超4万个比17%。
数据知识产权登记工作在我国正快速推进,截止2024年12月31日,多个省市已经出台了相关政策并建立了登记平台。累计数据知
数据知识产权登记工作在我国正快速推进,截止2024年12月31日,多个省市已经出台了相关政策并建立了登记平台。累计数据知识产权登记总量突破2万件,登记主体层面呈现多样性,包括企业、个人、机构等,登记行业集中度高,三大行业占比超50%。
根据遇见数据集平台监测数据分析,截止2024年12月底,数据交易市场总披露交易金额突破550亿元,总挂牌数据产品超4万个。超2000家企业供应数据,其中在多家交易所上架的企业占比17%。
在人工智能领域的顶级会议NeurIPS上,斯坦福大学的杰出教授李飞飞发表了题为《From Seeing to Doing: Ascen
2024-12-21,由MIT和OpenAI联合创建的个性化视觉数据集,为细粒度和数据稀缺的个性化视觉任务提供了新的研究和应用价值。
2024-12-15,由纽约大学计算机科学助理教授谢赛宁团队联合斯坦福大学的杰出教授李飞飞和耶鲁大
2024-10-31,由香港科技大学(广州)和四川大学联合创建的多模态时空数据集Terra,跨越全球,为地球科学领域提供了
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号