遇见数据集-让每个数据集都被发现,让每一次遇见都有价值。
2024-11-20, 由武汉大学、中国科学院自动化研究所、悉尼科技大学、牛津大学等合创建了DriveMLLM数据集,该数据集是自动驾驶领域首个专为评估多模态大型语言模型(MLLMs)空间理解能力而设计的基准,对于推动自动驾驶技术的发展具有重要意义。
2024-09-29 ,NeurIPS发布首个面向专业人士的大型语言模型图分析数据集GraphPro。这是首个目的测试和提升LLMs在图分析任务上表现的基准。该数据集的创建不仅填补了现有基准测试的空白,还为LLMs在图分析领域的应用提供了新的视角。
2024-06-12 ,由上海人工智能实验室、哈尔滨工业大学、南京大学、复旦大学等联合创建OmniCorpus,一个达到百亿级别的图文交错数据集。它不仅规模空前,更以其多元化的数据来源和高质量的数据内容,为多模态大语言模型的研究提供了坚实的数据基础。
数据集是金融分析和投资决策中非常重要的资源,它包含了股票市场的各种信息,如价格、交易量等等。
2024-09-30,由多伦多大学航天与地面自主机器人系统实验室(STARS)与多伦多机器人与人工智能实验室(TRAIL)联合MDA太空公司,共同创建了ALLO(Anomaly Localization in Lunar Orbit)数据集。这个数据集填补了月球轨道空间操作异常检测领域的空白,为机器人在复杂太空环境中的自主性提升提供了重要支持。
2024-10-03, 英国诺丁汉大学数学科学学院的Gary R. Mirams教授团队创建了一个基于英国地形的二维优化基准数据集,该数据集包含了经过修改的英国地形数据,并从中识别出了957,174个局部最优解,为优化算法的评估提供了新的视角。
2024-10-03,由中国科学院自动化研究所创建的VideoCube数据集,探索如何使计算机视觉任务在目标跟踪方面更加接近人类的能力。这个数据集的意义在于提供了一个高质量、大规模的基准测试平台,能够模拟真实世界的复杂环境,为衡量和提升目标跟踪算法的智能水平提供了重要的科学评估工具。
自动驾驶是一个快速发展的行业,它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面,自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等,以及强大的计算平台来处理大量数据,自动驾驶数据集是训练和验证自动驾驶系统的关键资源,它提供了丰富的场景和条件,使算法能够学习和适应复杂的真实世界驾驶环境。
2024-08-28,由上海交通大学与SenseAuto研究联合构建了一个名为RoboSense的大规模多传感器数据集。该数据集覆盖了超过133K同步数据帧,包含1.4M个3D边界框和ID注释,形成了216K条轨迹,为低速自动驾驶领域的研究提供了宝贵的资源。
低速无人驾驶是未来智能交通与智慧城市建设的重要组成部分,是下一代智能地面运载工具演变的基础,对我国智能交通发展具有重要意义。近年来,物流配送、环卫清扫、无人港口、安防巡逻、移动零售、救援侦查、矿区开采车、高尔夫球车、园区巴士等运营场景对低速无人车的需求日益旺盛,产业得到迅猛的发展。
2024-10-04,由浙江大学和罗格斯大学研究人员的共同努力下,诞生了Agent Security Bench (ASB),这是首个全面评估大型语言模型(LLM)驱动的智能体在面对各种袭击和防御策略时安全性的综合基准框架。ASB的出现,不仅填补了现有文献在综合评估LLM基础智能体安全性的空白,更为智能体安全领域的发展提供了重要的基准测试和研究方向。
2024-10-04,为了提升大型语言模型在不同文化背景下的实用性,华盛顿大学、艾伦人工智能研究所等机构联合创建了CulturalBench。这个数据集包含1,227个由人类编写和验证的问题,覆盖了包括被边缘化地区在内的45个全球区域。CulturalBench的推出,目的通过一个稳健、多样化且具有挑战性的基准测试,衡量并跟踪我们在提升LLMs文化知识方面的进步。
2024-07-15,为了推进自动驾驶卡车技术的发展并确保其在公共道路上的安全性,由慕尼黑工业大学和MAN Truck & Bus SE联合创建了MAN TruckScenes数据集。数据集首次为研究社区提供了一个包含丰富环境条件下的卡车特定挑战,如拖车遮挡、新型传感器视角和终点站环境的多模态数据集,具有里程碑式的意义。
2024-10-05,南加州大学和伊利诺伊大学香槟分校的研究人员揭示了现有成员推断袭击Membership inference attacks (MIAs)评估中的关键缺陷,并引入了CopyMark,这是一个更现实的MIAs基准,它支持预训练扩散模型、无偏数据集和公平评估流程。
2024-10-04, 由华东师范大学、哈索·普拉特纳研究所和上海交通大学的研究团队联合创建了CliMedBench。这是一个包含14个专家指导的核心临床场景的综合基准,旨在全面评估LLMs的医疗能力。数据集由顶级三级医院的真实医疗报告和真实的考试练习中提取出33,735个问题构成,其可靠性已经得到了验证。
2024-10-04,由Ekstra Bladet创建的EB-NeRD数据集,为新闻推荐系统的设计提供了丰富的用户行为数据和新闻文章内容,目的解决新闻推荐中的技术与规范性挑战,推动负责任的新闻推荐系统的发展。
2024-10-08,由尼泊尔应用数学与信息学研究所机构创建了TuneVLSeg基准测试框架,这个框架使得Prompt调优在视觉-语言分割模型(VLSMs)的应用变得可行,并推动了对显著领域偏移下模型性能的理解。
2024-10-08,由法国尼斯大学CNRS、Inria、I3S以及西班牙巴斯克大学HiTZ中心的研究人员们创建了首个多语言医疗问答数据集CasiMedicos-Arg,在医学领域,AI系统的决策不仅需要准确,还需要能够被医生和患者理解。该数据集其中包含正确和错误的诊断结果,并由医生提供自然语言解释。
2024-10-08,由哈尔滨工业大学(深圳)和清华大学深圳国际研究生院的研究人员联合创建的MIBench,作为首个模型反演袭击和防御的实用基准测试,不仅集成了16种最先进的袭击和防御方法,还提供了9种常用评估协议,为标准化和公平的评估分析提供了便利。MIBench的建立,目的通过全面比较和分析不同场景下各种方法的性能,克服以往工作中的不一致问题,推动该领域的进一步发展。
2024-10-07,由意大利博洛尼亚大学经济系创建 EA-MD-QD 的大型数据集,数据集涵盖了欧元区及其十个主要成员国的季度和月度宏观经济时间序列数据。EA-MD-QD 的创建为宏观经济研究提供了宝贵资源,使其成为分析欧元区经济结果和政策分析的重要工具。
约翰·J·霍普菲尔德创造了一种关联记忆,它能够存储和重构图像以及其他模式类型。杰弗里·E·辛顿发明了一种能够自主发现数据中属性的方法,并执行任务,如识别图像中的特定元素。辛顿将霍普菲尔德网络的想法应用于一种新网络,这种新网络使用另一种方法:玻尔兹曼机。玻尔兹曼机可以学习给定数据类型的特征元素,可以用来分类图像或创建新材料。这种机器学习帮助推动了当今机器学习的快速发展。
2024-09-01 ,在蛋白质结构研究领域,复旦大学的研究团队创建了Dynamic PDB数据集,这是一种新的数据集 Dynamic PDB,目的在捕获蛋白质的动态行为,以及一套全面的物理特性,例如原子速度和力、势能和动能以及模拟环境的温度。弥补了传统静态蛋白质数据库的不足,为深入理解蛋白质的动态行为和相关模型设计提供了宝贵的资源。
2023-12-07,由普渡大学、伊利诺伊大学厄巴纳-香槟分校、弗吉尼亚大学和丰田汽车北美信息技术实验室共同创建了LaMPilot数据集,这个数据集的意义在于为自动驾驶领域提供了一个专门评估大型语言模型程序性能的基准,推动了自动驾驶系统在理解和执行自然语言指令方面的进步。
2024-10-10,由北京航空航天大学人工智能研究所、香港中文大学MMLab以及感知与交互智能中心共同创建了OpenUAV数据集,首个专为现实无人机(UAV)视觉语言导航(VLN)任务设计的大型轨迹数据集,该数据集通过模拟真实环境和飞行动态,为无人机导航研究提供了重要的资源和挑战。
2024-10-09,由捷克布尔诺理工大学的研究人员创建了Diffusion Deepfake Speech,一个基于扩散模型的深度伪造语音数据集,对于评估和改进现有的深度伪造检测系统具有重要意义。
化学家们长久以来一直梦想着完全理解和掌握生命的化学工具——蛋白质。 众所周知,蛋白质是人体内最重要的化学物质,知道了它的结构,就可以知道很多病症是如何产生,又如何研发药品进行医治的。
2024-10-10,北京大学联合多个机构和企业创建了Omni-MATH数据集,是一个大型语言模型在奥林匹克数学竞赛级别的数学推理能力进行评估的综合基准。这个数据集的创建意味着我们有了更严格的工具来测试和提高模型在解决复杂数学问题上的性能。
2024-10-10,由浙江大学和阿里巴巴集团联合创建的WORFBENCH,一个用于评估大型语言模型(LLMs)生成工作流能力的基准测试。它包含了一系列的测试和评估协议,用于量化和分析LLMs在处理复杂任务时分解问题和规划执行步骤的能力。WORFBENCH 通过模拟多种应用场景和复杂的图结构工作流,为研究人员提供了一个统一的框架来评估和比较不同LLMs的性能。
2024-10-10,由电信研究所、里斯本大学等联合创建MT-Pref数据集,它包含18种语言方向的18k实例,覆盖了2022年后的多个领域文本。通过在WMT23和FLORES基准测试上的实验,我们展示了使用MT-Pref数据集对Tower模型进行对齐可以显著提高翻译质量。
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号