自古以来,人类对人工智能就有持久、狂热的追求,从语音识别到智能音箱,从无人驾驶到人机对战,人工智能给人类社会带来了一次又一次的惊喜,被人工智能赋能的各行各业都在焕发新的生机。在人工智能垂直领域商业化繁荣的背后,是基础层的软硬件支撑,以及技术层的语音识别/自然语言处理、计算机视觉等应用的渐入佳境。
2018年8月26日,百度为2018人工智能创意赛集训营邀请了中国高校计算机大赛人工智能创意赛专家委员会主任、浙江大学计算机学院副院长、博士生导师吴飞教授,为你呈现人工智能的前世今生。
注:以下为吴飞教授的演讲实录
回溯人工智能的起源
人工智能定义以机器为载体,实现人类智能或生物质能,机器这个载体就是计算平台,必须思考人工智能所依赖的计算平台的起因是什么,什么东西能实现人类智能或者生物智能,计算这个概念的产生可以回溯到20世纪30年代,当时的人们发现有很多问题是不可以计算的,也有大量的问题是可以计算的。
图一:费马大定理
比如费马大定理,希望计算N等于2的时候直角线的平方之和等于斜边,N等于2的时候存在无穷解。这里成了数学家的梦魇,经过几百年的努力,现在已经证明了当N大于等于3的时候,费马大定理不存在解。
这个时候也存在很多不可解的问题,或者需要我们去计算的问题,比如前阵子大家看到很多新闻报道,张教授证明了孪生素数的问题。相差2的素数对,例如3和5,5和7,是否存在无穷多个素数对,存在无穷多个,差小于7000万的素数对,如果两个素数之间的差小于7000万,存在着无穷多素数对,这是一个孪生素数的证明。实际上我们再回看数学历史三大猜想,第一个是费马大定理,这个通过数学家的努力证明了。第二个四色定理,一张地图上只需要四种颜色,可以把不相邻的国家用不同的颜色标明出来,四种颜色足够多了,这个已经被证明了。最后一个是未得到证明的哥德巴赫猜想。这些问题的原因是什么,我们讲如果证明也是一种计算的过程,是否存在一种计算的装置,可以把需要我们证明的问题或者计算的问题一步一步的按照机械的方式求解出来。
为了解决这个问题,在20世纪30年代同时产生三种计算平台,分别概括为原始递归函数,图灵机,这是英国计算机鼻祖图灵提出的,还有lambda,这三种都是计算平台,证明三种计算平台的能力是一样的,图灵机能解决的问题,在原始递归函数和lambda积分都可以被解决,最终图灵机成为了计算的平台,也就成为计算机理论的模型的鼻祖。可以现在定义计算,什么是可以计算的,图灵机如果在若干步骤之后可以停下来给出答案本身,这个问题是可以被计算的,如果图灵机永远在计算,永远给不出答案的本身,不停机,这个问题是不可计算的,也就是图灵不可停机。
图二:《论数字计算在决断问题中的应用》
图灵为了解决这个问题,说什么是可以计算的,什么是不可以计算的,在1937年发表一篇文章《论数字计算在决断问题中的应用》。这篇文章里图灵提出了图灵机的模型。他说任何可以被计算的问题,可以通过这套装置原则性的像机械装置一样一步一步求解。机械装置有哪些组成部分,一个是两端无限长的纸带,上面放上数字和程序指令,有一个控制器,有读写头,读写头每次读入内容,按照控制器的指令或者对纸带上的内容读入,或者左移或者右移,如果有这么一套装置,任何可以被计算的问题均可以原则性的被这个装置所完成。举一个简单的例子,比如1+2等于3,图灵机怎么完成,1+2被写进去,图灵机读1这个数字,这是一个数字,不做任何操作,向右移动一个纸带,发现+的符号,图灵机的控制器说已读入加法符号,相右寻找被加数,找到之后写上3,其他数字就被删除。这个过程把1+2计算出来了。
因此图灵机现在变成现代计算机的理论模型,现在计算机所有的计算的步骤都是按照图灵机的理论模型来进行实现的,因此图灵成为计算机理论鼻祖。为了纪念他,1966年设立了图灵奖。图灵一生也是比较短暂的,只在人类的世界上存活了42年。虽然是计算机理论鼻祖,但他的去世是悲剧性的事件。去世的时候床头留下了一个咬了一口的苹果,自杀身亡。我们知道苹果公司的logo也是咬了一口的苹果,所以都希望苹果公司出面解释,为了纪念图灵而把logo设置成咬了一口的苹果,但苹果公司从未对logo作出任何正面的解读。图灵的自杀身亡因为受到当时社会的不公正的待遇,英国首相在2009年向图灵表示深深的歉意。
图三:Enigma
图灵在二战期间有一个解码小组,研制一个密码破译器Enigma,它直接破译了德军的密码,将二战的结束时间提前了三到五年。虽然在人类的历史长河中图灵存在的时间非常短暂,但他不仅创造了计算机理论模型,且在实际应用中也做出很大的贡献。
人工智能学科的诞生
人工智能学科意义上的诞生,是在1955年登上人类历史舞台。1955年两个很年轻的学者和两个年长的学者他们一起给美国的私人基金会写了一个项目申请书,项目申请书的题目叫做希望在夏天开展一个研究项目,项目的名字是有关AI。至此,AI这个单词在1955年8月31日登上了人类的历史舞台。他们希望私人基金会资助一笔钱,在1956年的夏天有十几个学者能开展有关人工智能的研究,研究要让机器像人那样认知、思考和学习,即用计算机模拟人的智能。
私人基金会批准这个项目,为了让这个项目被批准,在报告里列举了人工智能值得关注的七个问题,分别叫做自动计算机,计算机编程,神经网络,计算的复杂性,人工智能算法的智慧学习与提高,归纳与演绎,随机与创造力。他们认为在1956年这七个问题是让计算机模拟人的智能活动所必须解决的关键问题。那前面四个问题是计算机理论科学正在如火如荼进行研究的问题。国家有863重点研发计划叫高考机器人,题目叫做基于大数据的内容智能的算法,这个项目下面设九个课题,分别要去参加高考数学,高考语文,高考历史和高考地理的高考,希望考进前20%的水平。九个课题已经验收完毕。专家介绍,一旦涉及到这样的题目,他们称为自然语言类的题目,高考机器人无能为力。高考机器人只有对公式型的试题表现的能力非常强大,比如三角函数的分解,求某条直线,垂直于另外一个平面,对这样的公式型的推导问题,高考机器人表现的能力非常强大,但是一旦碰到应用题或者语言类的题目,将无能为力。
举个简单的例子,比如鸡兔同笼的问题,一个笼子里面,鸡和兔一共有几条腿,问鸡有几只,兔有几只。机器人必须知道鸡有两条腿,兔子有四腿。在不知道这些的情况下,高考机器人也无能为力。人工智能提出来之后就迈上了征程,最初的征程是希望完全的替代人类,完全复制人类的大脑,但是从发展的历史道路来看,我们发现人工智能按照取代人类的部分工作的道路在不断向前发展,比如用机器来进行定义的证明,去取代解题专家,进行机器的翻译。大家看到广告片,百度公司的机器翻译做的非常好,获得国家科技进步奖。这是用机器进行语言的翻译,来替代我们的翻译工作者,用专家系统,比如面向医学的专家系统来替代医生等。
人工智能三种种类:领域人工智能、通用人工智能、增强人工智能
从智能角度对人工智能进行三种不同的分类,第一种称为领域人工智能,这种人工智能指任务导向,比如像Deep Blue和AlphaGo,计算能力非常强大,计算非常快,数据非常多,因此超越了人类。但这种超越只是在任务上面的超越,比如AlphaGo,战胜了李世石,战胜了人类,获得九段的水平。但是让AlphaGo做交通的预测,去做其他的工作,他无能为力。因为AlphaGo的成长是依赖于围棋的大数据,并没有把交通的大数据输入给它,因此这种人工智能就是弱人工智能,是在目标比较明确的领域上面超越了人类。第二个通用人工智能或跨领域人工智能,这个只有人类所具有,人类具有很强的举一反三,从经验中学习的能力,我们人的大脑并不是靠大数据驱动,或者不完全靠大数据驱动,我们有很强的归纳能力,很强演绎能力,可以把大数据厚积薄发,归纳和演绎的能力非常强大,这是人类通用的人工智能所具有的能力。
图五:混合增强人工智能
第三种是增强人工智能,机器智能有它的长处,人类的智能有它的长处,能不能把人类智能和机器智能进行叠加,形成人机混合的形态,我们叫混合增强人工智能。比如图五中第三四张图片达芬奇手术机器人,人类的医生坐在机器人的后端操作施展复杂的外科手术,如它可以把一个葡萄皮剥开,再缝制成功。这种高超的外科手术可能人类医生很难完成,但依靠工业级的前端的手术操作手,加上经验非常丰富的人类医生进行指挥,就可以把复杂的外科手术完成。 图五的第二张图片是巴西世界杯残障人士,他的脚不能运动,但是科学家们给他装上一个外骨骼机器人,探索他踢球的脑电波,外骨骼机器人利用脑电波进行提交,就开出巴西世界杯第一个球。本身这个脚已经失去了这个功能,但是有强大的机器和人类的意识形态的混合增强人工智能叠加在一起,就完成了开球的动作。因此长远来讲,今后是人工智能和机器智能紧密的结合在一起,共同完成一些不可能完成的任务,如图五第一张图片里的智慧城市,这个里面人机物网是相互联系在一起,各方面的能力进行叠加,就演化成1+1大于2智能行为的系统。这是人工智能的历史和发展。
人工智能的今生:5G、IOT、芯片
图六:钢铁、电力、硬件、软件、软/硬协同的历史发展之路
在美国时间8月2号苹果公司的股票市值已经突破了一万亿美元的大关,这是整个股票公司市值突破的比较关键的历史关口。我们看到目前有关IT技术为主的美国的公司,在近十年来公司和市值都在不断的增长, IT公司纷纷像百度一样把人工智能作为他们的首要的研究的方向,用人工智能来提升他们的产品。我们也看到,在美国的股票市场上面,实际上经历了几次门槛的节点,比如图六中1901年,美国钢铁公司股值超过10亿美元,通用电气公司超过100亿美元,高股票值的公司从钢铁时代到电力时代到硬件时代到软件时代的迈进,一万亿美元的超越,下一个十万亿美元的公司他们的主打产品可能是什么,可能像计算服务的公司将是下一个时代可能会将超越十万美元的公司。
人工智能的生态是怎么形成的?现在人工智能正往云网端芯生态逐渐形成,云就是智能云,研究很多数据都放在云端,数据传送到云端之后,云端强大的计算资源把数据处理完毕再返回客户端,或者终端。我们看到过去几年,云计算这个概念在几大公司正在持续的发力,像亚马逊、微软、谷歌、IBM在全球云计算上面的份额的分布。第二个叫做网,网是涉及到两方面,一个是5G时代的到来,第二个就是物联网的深入。5G的时代,从1G、2G、3G到4G,从简单数据的传输到数据的交互能力,以及到5G时代,延时性的下降,可靠的提升,数据传输的能力不断的增强,我们将迎来一个数据的快速的传输以及快速的交互,以及安全保障能力的提升,这就是一个网其中的一个方面。
第二个就是物联网叫做IOT,所有的终端设备将不可避免的因为具有IP地址被融入到大的物联网的网络中。预计到2020年,智能设备的总数将超过200亿台,这些设备将非常智能,甚至无需一直连接到云端,就能具备看、听、推理和预测的能力。刚才片子里面讲的百度无人车,其实也是强大的终端的计算能力,能实时的识别马路上的行人,交通端以及任何一种障碍物,快速的作出一些判断,这些就是端计算的时代的来临。我们也把它称为边缘计算,边缘计算的特点就是快速反馈,能够进行安全隐私的保护,能耗比较低。那么我们现在看到非常多的IT公司,他们在打造他们的云计算的平台的时候,也在关心边缘计算的平台,像亚马逊、微软、百度等,他们纷纷在不停的推出自己的云计算的平台的同时,也在着眼边缘计算的生态的形成。
我们也可以看到现在的深度学习的算法快速的从云端向边缘计算的终端进行蔓延,一些更加高效的深度学习的算法,从大量的以计算为主的大型设备上,向以边端,计算资源不是很丰富的边缘时代进行迈进。那么这里也有一些从学术研究上面,为了加快终端的算法的执行,有些软件加速和硬件加速的方法,现在被快速提出来,这是边缘计算的端为主的生态。那么我们看到我们有云端计算强大以数据为中心的云端的强大的计算能力,也有数以万计的终端设备需要通过高效计算原则,来搭建起来一些边缘计算的推理能力。
最后一个就是芯片,那么芯片的发展是以三个不同的阶段,比如CPU是通用的芯片,然后出现了矩阵计算为核心的GPU的加速计算芯片的能力,又有半定制的FGPA的芯片,还有全定制的专用芯片的发展,最后就是要模拟人的大脑一样的神经形态的芯片。现在的芯片的发展,正迈向从通用到专用,从计算到神经形态的迈向的阶段。这些神经形态的芯片基本的原则是非常稀疏,人的大脑有60亿神经元,并不是每时每刻都在运转,如果每时每刻进行运转,人的大脑一天不是20瓦的电力,可能大脑每时每刻都在冒烟,所有神经元都要高度计算,我们需要的电力是非常强大的。所以神经计算的宗旨就是稀疏化的计算。
人工智能生态的形成正在按照从人和人的相连,到人和物的相连,再到物和物的相连,现在正迈向人机物相连的三元空间的时代,这个时代里面,云端、网端、终端和AI芯片的人工智能的生态,从最近几年来看,正在快速的成长和快速的形成。浙江大学建设人工智能的载体,百度、德清和浙江大学一起协办的高校计算机大赛人工智能创新赛就是其中一个方面,我们还在像高中教材的编写的工作,以及大学教材的编写参加人工智能创意赛的比赛。我们想人工智能的生态还是有三个很重要的方面,一个就是要夯实基础研究以形成创新之源,二是技术交叉以具备创新之力,第三则是面向场景AI以赋能社会所需,总结起来是能力源,这是生态形成过程里面推进生态形成的比较清晰的思路。
----实录结束-----
结语:拥抱人工智能,享受智慧生活
人工智能是一门多学科交叉的综合性前沿学科,理论日趋完善,技术逐渐突破,应用上也在快速扩展和深入生活,可以预见,在算法、基础设施发展的未来,人工智能的发展和多样化的生态将会改变所有人的生活。
吴飞 中国高校计算机大赛人工智能创意赛专家委员会主任,浙江大学计算机学院副院长、浙江大学人工智能研究所所长、浙江大学求是特聘教授,博士生导师。主要研究领域为人工智能、跨媒体计算、多媒体分析与检索和统计学习。视觉感知教育部-微软重点实验室(浙江大学)副主任。国家杰出青年基金获得者(2016年)、教育部新世纪优秀人才支持计划入选者(2011年度)。