北京时间10月8日下午,2024年诺贝尔物理学奖揭晓。瑞典皇家科学院决定将2024年诺贝尔物理学奖授予美国普林斯顿大学约翰·霍普菲尔德和加拿大多伦多大学杰弗里·辛顿。

两位科学家因“用于通过人工神经网络实现机器学习的基础性发现和发明”摘奖,以表彰他们利用人工神经网络实现机器学习的奠基性发现和发明。他们将平分1100万瑞典克朗(约合745万元人民币)奖金。

这个获奖结果一出,很多关注诺贝尔物理学奖的人士都很意外,因为两位科学家的研究领域和成果看上去“太不物理”了。据介绍,两位获奖者从20世纪80年代起就开展了与物理学相关的人工神经网络的重要工作。

两位获奖科学家是使用物理学工具开发了今天机器学习技术的基础方法。

约翰·J·霍普菲尔德创造了一种关联记忆,它能够存储和重构图像以及其他模式类型。杰弗里·E·辛顿发明了一种能够自主发现数据中属性的方法,并执行任务,如识别图像中的特定元素。辛顿将霍普菲尔德网络的想法应用于一种新网络,这种新网络使用另一种方法:玻尔兹曼机。玻尔兹曼机可以学习给定数据类型的特征元素,可以用来分类图像或创建新材料。这种机器学习帮助推动了当今机器学习的快速发展。



数据集:MNIST

  • 创建时间:2020-05-20
  • 链接地址: MNIST|手写数字识别数据集|计算机视觉数据集
  • 数据集说明: MNIST是一个手写数字图像数据集,包含60,000个训练样本和10,000个测试样本。发布于1998年,由美国国家标准与技术研究院(NIST)发布。广泛应用于图像分类和神经网络训练,是深度学习领域的经典数据集之一,被大量论文引用。


数据集:CIFAR-10

  • 创建时间:2018-04-28
  • 链接地址: CIFAR-10|图像分类数据集|机器学习数据集
  • 数据集说明: CIFAR-10包含60,000张32x32像素的彩色图像,分为10个类别,每类6,000张。发布于2009年,由加拿大高等研究院(CIFAR)发布。常用于图像分类和神经网络性能评估,具有较高的权威性和广泛的应用。


数据集:ImageNet

  • 创建时间:2018-12-26
  • 链接地址: Imagenet|计算机视觉数据集|深度学习数据集
  • 数据集说明: ImageNet是一个大规模的图像数据集,包含超过1400万张标注图像,涵盖2万多个类别。发布于2009年,由普林斯顿大学和斯坦福大学等机构合作发布。广泛用于图像识别和神经网络研究,是计算机视觉领域的重要基准数据集。


数据集:COCO

  • 创建时间: 2021-11-18
  • 链接地址: COCO|对象检测数据集|图像分割数据集
  • 数据集说明: COCO(Common Objects in Context)包含超过33万张图像,250万个对象实例,80个对象类别。发布于2014年,由微软发布。广泛用于目标检测、分割和图像描述等任务,是计算机视觉领域的重要数据集。


数据集:Fashion-MNIST

  • 创建时间: 2022-03-17
  • 链接地址: Fashion-MNIST|图像识别数据集|机器学习数据集
  • 数据集说明: Fashion-MNIST是一个包含70,000张28x28像素灰度图像的数据集,涵盖10个时尚类别。发布于2017年,由德国Zalando Research发布。用于替代MNIST进行图像分类和神经网络训练,具有较高的实用性和广泛的应用。


数据集:SVHN

  • 创建时间: 2022-03-17
  • 地址: SVHN|图像识别数据集|机器学习数据集
  • 数据集说明: SVHN(Street View House Numbers)包含600,000张32x32像素的彩色图像,涵盖数字识别任务。发布于2011年,由谷歌研究院发布。广泛用于图像分类和神经网络训练,具有较高的权威性和实际应用价值。


数据集:CIFAR-100

  • 创建时间: 2022-03-17
  • 链接地址: CIFAR-100|图像识别数据集|机器学习数据集
  • 数据集说明: CIFAR-100是CIFAR-10的扩展版本,包含60,000张32x32像素的彩色图像,分为100个类别,每类600张。发布于2009年,由加拿大高等研究院(CIFAR)发布。常用于图像分类和神经网络性能评估,具有较高的权威性和广泛的应用。


数据集:KITTI

  • 创建时间:2012
  • 地址: KITTI|自动驾驶数据集|计算机视觉数据集
  • 数据集说明: KITTI包含超过7,000张图像和相应的激光雷达数据,涵盖自动驾驶和机器人视觉任务。发布于2012年,由德国卡尔斯鲁厄理工学院发布。广泛用于自动驾驶和3D目标检测研究,具有较高的实用性和权威性。

数据集:Cityscapes

  • 创建时间: 2024-04-29
  • 链接地址: Cityscapes|自动驾驶数据集|实时语义分割数据集
  • 数据集说明: Cityscapes包含5,000张精细标注的城市街道场景图像,涵盖30个类别。发布于2016年,由德国达姆施塔特工业大学发布。广泛用于语义分割和自动驾驶研究,具有较高的权威性和实际应用价值。


数据集:ADE20K

  • 创建时间: 2022-03-17
  • 链接地址: ADE20K|计算机视觉数据集|图像分割数据集
  • 数据集说明: ADE20K包含超过25,000张图像,涵盖150个语义类别。发布于2017年,由麻省理工学院发布。广泛用于语义分割和场景理解研究,具有较高的权威性和广泛的应用。


数据集:LFW

  • 创建时间: 2019-09-21
  • 链接地址: LFW|人脸识别数据集|计算机视觉数据集
  • 数据集说明: LFW(Labeled Faces in the Wild)包含超过13,000张人脸图像,涵盖5,749个不同人物。发布于2007年,由美国马里兰大学发布。广泛用于人脸识别和神经网络训练,具有较高的权威性和实际应用价值。


数据集:CelebA

  • 发布时间: 2022-03-17
  • 链接地址: CelebA|人脸识别数据集|计算机视觉数据集
  • 数据集说明: CelebA包含超过20万张名人面部图像,涵盖40个属性标注。发布于2015年,由香港中文大学发布。广泛用于人脸识别、属性预测和生成对抗网络(GAN)研究,具有较高的权威性和广泛的应用。


数据集:20 Newsgroups

  • 发布时间: 2022-05-23
  • 链接地址: 20 Newsgroups|文本挖掘数据集|自然语言处理数据集
  • 数据集说明: 20 Newsgroups包含超过20,000篇新闻组文档,涵盖20个不同主题。发布于1995年,由美国卡内基梅隆大学发布。广泛用于文本分类和神经网络训练,具有较高的权威性和实际应用价值。