这是土盐的第118篇原创文章
1
大家好,我是土盐。
刚瞄了几眼《AI 未来》,其中有句话,让我印象深刻:人生是由无数转折点组成的。
这里再次推荐李开复的一本《人工智能》,也许人工智能是您职业的转折点。
人工智能
李开复 王咏刚
133个笔记
无处不在的人工智能
统统上传到云端,不用进行任何手工整理、分类或标注,谷歌照片会自动识别出照片中的每一个人物、动物、建筑、风景、地点,并在我需要时,快速给出正确的检索结果。
知识引擎和个人助理。
谷歌的机器翻译技术可以利用英文到阿拉伯文之间的对应语料,以及中文到英文之间的对应语料,训练出一个支持多语言间相互翻译的模型,完成中文和阿拉伯文的双向翻译。
计算机在辅助驾驶的过程中依靠车载传感器实时获取的路面信息和预先通过机器学习得到的经验模型,自动调整车速,控制电机功率、制动系统以及转向系统,帮助车辆避免来自前方和侧方的碰撞,防止车辆滑出路面。
到底什么是人工智能?
思维法则,或者说,逻辑学,是一个人的思考过程是不是理性的最高判定标准。
Dendral项目在20世纪60年代中期取得了令人瞩目的成功,衍生出一大批根据物质光谱推断物质结构的智能程序。Dendral之所以能在限定的领域解决问题,一是依赖于化学家们积累的有关何种分子结构可能产生何种光谱的经验知识,二是依赖符合人类逻辑推理规律的大量判定规则。Dendral的成功事实上带动了专家系统在人工智能各相关领域的广泛应用,从机器翻译到语音识别,从军事决策到资源勘探。一时间,专家系统似乎就是人工智能的代名词,其热度不亚于今天的深度学习。但人们很快就发现了基于人类知识库和逻辑学规则构建人工智能系统的局限。
我们并不知道,到底要在哪一个层面(大脑各功能区相互作用的层面?细胞之间交换化学物质和电信号的层面?还是分子和原子运动的层面?)真实模拟人脑的运作,才能制造出可以匹敌人类智慧的智能机器。
“我最不喜欢的描述是‘它像大脑一样工作’,我不喜欢人们这样说的原因是,虽然深度学习从生命的生物机理中获得灵感,但它与大脑的实际工作原理差别非常非常巨大。将它与大脑进行类比给它赋予了一些神奇的光环,这种描述是危险的。这将导致天花乱坠的宣传,大家在要求一些不切实际的事情。人工智能之前经历了几次寒冬就是因为人们要求了一些人工智能无法给予的东西。
第三次AI热潮:有何不同?
高德纳咨询公司(Gartner)技术成熟度曲线(CC BY-SA 3.0, Wikipedia)[插图]这条曲线概括了绝大多数高新技术的发展历程。更重要的是,每年高德纳公司都会根据当年度所有流行技术的发展、成熟状况,制作出一张当年各流行技术在高德纳曲线上的发展位置图示,标示出每种前沿技术是处在萌芽期、泡沫期、低谷期还是成熟期,以及每种未达成熟期的技术还需要几年才会真正成熟起来。
投资者经常根据高德纳曲线来判断时代潮流,选择投资方向。
图灵测试与第一次AI热潮
在机器试图模仿人类与评判者对话的“模仿游戏”中,有思考能力的电子计算机可以做得和人一样好吗?
例如,聊天程序基于搜索引擎索引到的互联网网页建立知识库,从海量的页面信息中搜集可能的常见问题、常见回答的组合,这已经成为一种非常成熟的技术。当我们与这些程序聊天时,实际上既是一次人机间的对话,也是一次对机器背后庞大知识库的搜索操作。
语音识别与第二次AI热潮
以专家系统为代表的符号主义学派(Symbolic AI)。
深度学习携手大数据引领第三次AI热潮
《一种深度置信网络的快速学习算法》
“马文是为数不多的人工智能先驱之一,他用自己的视野和洞见,将计算机从一部超强加法器的传统定位中解放出来,并为其赋予了新的使命——有史以来最强大的人类力量倍增器之一。
“理解大脑这件事似乎比理解音乐要难一些,但我们应该知道,有时对问题领域的扩展可以让问题变得更简单!在好几个世纪的时间里,代数方程的平方根理论都受困于由实数构成的狭小世界,但在高斯揭示出更大的复数世界后,一切都变得简单起来。类似地,一旦能穿透听众的心灵,音乐就会显示出更为丰富的内涵。”
《一种深度置信网络的快速学习算法》
我这个程序里用的是相对简单的贝叶斯分类器,自动从每一盘对局中,提取四个原始特征,然后用贝叶斯分类器将这些特征综合起来进行计算,以估算下一步走在某个位置的赢棋概率。在这个思路的基础上,人工神经网络是可以发挥作用的。此外,我当时也使用了一个与今天AlphaGo类似的思路,就是让计算机程序自己和自己下棋,然后从几百万个已知的行棋步骤中,归纳出赢或者输的概率,并用类似的方法不断迭代,以达到最好的效果。
能够将‘为问题投入多少计算’和‘如何为我们关心的问题训练大型、强大的模型’方面的最高水平进一步提升。”
谷歌大脑正在帮助谷歌公司解决横跨多个领域的几乎所有人工智能的相关问题:谷歌的搜索引擎正在使用谷歌大脑优化搜索结果的排序,或直接回答用户感兴趣的知识性问题;谷歌的街景服务使用谷歌大脑智能识别街道上的门牌号,以进行精准定位;使用了谷歌大脑的谷歌翻译平台在2016年连续取得翻译质量的革命性突破,将全世界一百多种语言的相互翻译质量提升了一个层次;谷歌自动驾驶汽车正基于谷歌大脑对数百万英里的行驶记录进行训练,以改进驾驶策略,保证绝对安全……
深度学习和所有机器学习方法一样,是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。
用专业的术语来说,计算机用来学习的、反复看的图片叫“训练数据集”;“训练数据集”中,一类数据区别于另一类数据的不同方面的属性或特质,叫作“特征”;计算机在“大脑”中总结规律的过程,叫“建模”;计算机在“大脑”中总结出的规律,就是我们常说的“模型”;而计算机通过反复看图,总结出规律,然后学会认字的过程,就叫“机器学习”。
的是“田”。再往后,我们多半就要告诉小朋友,“田”上面出头是“由”,下面出头是“甲”,上下都出头是“申”。很多小朋友就是在这样一步一步丰富起来的特征规律的指引下,慢慢学会自己总结规律,自己记住新的汉字,并进而学会几千个汉字的。计算机分辨“一”“二”“三”“口”“田”。
当然,这种基于决策树的学习方法太简单了,很难扩展,也很难适应现实世界的不同情况。于是,科学家和工程师们陆续发明出了许许多多不同的机器学习方法。例如,我们可以把汉字“由”“甲”“申”的特征,包括有没有出头、笔画间的位置关系等,映射到某个特定空间里的一个点(我知道,这里又出现数学术语了。不过这不重要,是否理解“映射”的真实含义,完全不影响后续阅读)。也就是说,训练数据集中,这三个字的大量不同写法,在计算机看来就变成了空间中的一大堆点。只要我们对每个字的特征提取得足够好,空间中的一大堆点就会大致分布在三个不同的范围里。
接下来,看见一个新的汉字图像时,计算机就简单把图像换算成空间里的一个点,然后判断这个点落在了哪个字的区域里,这下,不就能知道这个图像是什么字了吗?
这就像一个试图用有限几种颜色画出世界真实面貌的画家,即便画艺再高明,他也很难做到“写实”二字。
从数学本质上说,深度学习与前面谈到的传统机器学习方法并没有实质性差别,都是希望在高维空间中,根据对象特征,将不同类别的对象区分开来。但深度学习的表达能力,与传统机器学习相比,却有着天壤之别。
假设深度学习要处理的数据是信息的“水流”,而处理数据的深度学习网络是一个由管道和阀门组成的巨大的水管网络。网络的入口是若干管道开口,网络的出口也是若干管道开口。这个水管网络有许多层,每一层有许多个可以控制水流流向与流量的调节阀。根据不同任务的需要,水管网络的层数、每层的调节阀数量可以有不同的变化组合。对复杂任务来说,调节阀的总数可以成千上万甚至更多。水管网络中,每一层的每个调节阀都通过水管与下一层的所有调节阀连接起来,组成一个从前到后,逐层完全连通的水流系统(这里说的是一种比较基本的情况,不同的深度学习模型,在水管的安装和连接方式上,是有差别的)。
比如,当计算机看到一张写有“田”字的图片时,就简单将组成这张图片的所有数字(在计算机里,图片的每个颜色点都是用“0”和“1”组成的数字来表示的)全都变成信息的水流,从入口灌进水管网络。我们预先在水管网络的每个出口都插一块字牌,对应于每一个我们想让计算机认识的汉字。这时,因为输入的是“田”这个汉字,等水流流过整个水管网络,计算机就会跑到管道出口位置去看一看,是不是标记有“田”字的管道出口流出来的水流最多。如果是这样,就说明这个管道网络符合要求。如果不是这样,我们就给计算机下达命令:调节水管网络里的每一个流量调节阀,让“田”。
这对我们学习和理解深度学习大有帮助。[插图]图28 训练深度学习模型时,整个深度神经网络的可视化状态[插图]最后,需要特别说明的是,以上对深度学习的概念阐述刻意避免了数学公式和数学论证,这种用水管网络来普及深度学习的方法只适合一般公众。对于懂数学、懂计算机科学的专业人士来说,这样的描述相当不完备也不精确。
谷歌的分布式处理三大利器——GFS、MapReduce和Bigtable就是在大数据的时代背景下诞生并成为绝大多数大数据处理平台的标准配置。利用这些数据处理平台,谷歌每天都会将多达数百亿的搜索记录清理、转换成便于数据分析的格式,并提供强有力的数据分析工具,可以非常快地对数据进行聚合、维度转换、分类、汇总等操作。
利用谷歌趋势(Google Trends)对过去5年全球地震分布进行分析汇总。我们很容易根据用户查询地震相关关键词的频率,看出过去5年内主要地震的发生时间和地点。在这里,谷歌趋势就是一个利用已有大数据建模、分析、汇总的有效工具。
任何有大数据的领域,都有创业的机会。
金融行业有大量客户的交易数据,基于这些数据的深度学习模型可以让金融行业更好地对客户进行风险防控,或针对特定客户进行精准营销;电子商务企业有大量商家的产品数据和客户的交易数据,基于这些数据的人工智能系统可以让商家更好地预测每月甚至每天的销售情况,并提前做好进货准备;城市交通管理部门拥有大量交通监控数据,在这些数据的基础上开发的智能交通流量预测、智能交通疏导等人工智能应用正在大城市中发挥作用;大型企业的售后服务环节拥有大规模的客服语音和文字数据,这些数据足以将计算机训练成为满足初级客服需要的自动客服员,帮助人工客服减轻工作负担;教育机构拥有海量的课程设计、课程教学数据,针对这些数据训练出来的人工智能模型可以更好地帮助老师发现教学中的不足,并针对每个学生的特点加以改进……
他们用情绪作为缰绳,套住人们,然后就再也不松手了。
2015年5月,三人联名在《自然》杂志发表的名为《深度学习》的综述文章。
AlphaGo带给人类的启示究竟是什么?
蒙特卡洛搜索算法。
在计算机科学界,懂得蒙特卡洛搜索算法原理的人都知道,这种算法主要是利用抽样统计来提高搜索效率,单用此算法确实难有提高空间。这是AlphaGo出现前,围棋界和计算机科学界两方面都不敢奢望人机大战即将到来的根本原因。
使用深度学习并结合蒙特卡洛搜索的AlphaGo。
机器视觉相关的深度学习技术,包含环境—决策—反馈的智能系统。
DeepMind选取了数十款当年在雅达利(Atari)街机上非常流行的小游戏,然后用人工智能程序尝试“理解”游戏当前画面,控制游戏操作接口,并根据每次游戏的输赢情况,不断调整策略,自主学习游戏技巧。
DeepMind已经开始用人工智能技术帮助谷歌的数据中心合理调度、分配电力资源,达到省电的目标。此外,DeepMind与牛津大学合作开发了根据人类说话时的口型猜测说话内容的唇读技术LipNet,与英国国家医疗服务体系(NHS)合作推出了综合性的医疗辅助应用Streams,与眼科医院合作帮助眼部疾病诊断……哈萨比斯说:“我坚信DeepMind正在从事的研究对人类的未来至关重要,而且这值得我们做出一些牺牲。”
AI利用增强学习技术,从自我对局中学习最优的扑克玩法,而避免从人类的既定模式中学习经验,这是非常重要的一点。
机器可以帮助人类制订更为复杂的医疗计划,可以在人类感到难以决策的领域,比如商业活动、城市规划、经济调控甚至战争指挥等,充当人类的“参谋”。也许,未来每个人都可以依靠强大的计算机和人工智能程序,成为运筹帷幄、决胜千里的战略家。
一台可以自动控制汽车行驶的计算机和一台可以将重物吊起的起重机,二者都需要严格的质量控制流程与安全监管策略。
一般认为,一个可以称得上强人工智能的程序,大概需要具备以下几方面的能力:1)存在不确定因素时进行推理,使用策略,解决问题,制定决策的能力;2)知识表示的能力,包括常识性知识的表示能力;3)规划能力;4)学习能力;5)使用自然语言进行交流沟通的能力;6)将上述能力整合起来实现既定目标的能力。
奇点来临?
如果整个人类大约6000年的文明史被浓缩到一天也就是24小时,我们看到的将是怎样一种图景? ·苏美尔人、古埃及人、古代中国人在凌晨时分先后发明了文字;·20点前后,中国北宋的毕昇发明了活字印刷术;·蒸汽机大约在22:30被欧洲人发明出来;·23:15,人类学会了使用电力;·23:43,人类发明了通用电子计算机;·23:54,人类开始使用互联网;·23:57,人类进入移动互联网时代;·一天里的最后10秒钟,谷歌AlphaGo宣布人工智能时代的到来……
“一个人工智能系统花了几十年时间达到了人类脑残智能的水平,而当这个节点发生的时候,电脑对于世界的感知大概和一个4岁小孩一般;而在这节点后一个小时,电脑立马推导出了统一广义相对论和量子力学的物理学理论;而在这之后一个半小时,这个强人工智能变成了超人工智能,智能达到了普通人类的17万倍。”
。霍金说:“人工智能可以在自身基础上进化,可以一直保持加速度的趋势,不断重新设计自己。而人类,我们的生物进化速度相当有限,无法与之竞争,终将被淘汰。”
霍金说:“工厂自动化已经让众多传统制造业工人失业,人工智能的兴起很有可能会让失业潮波及中产阶级,最后只给人类留下护理、创造和监督工作。”
人工智能十分强大,具有潜在的危险性。但这并不是因为智能机器会像人类一样思考,只是因为它们十分强大,我们必须小心使用它们。
智能是一个非常定性的概念,它反映的是某个人成功解决某种特定问题的能力。
今天的人工智能还不能做什么?
而帽子上的这些尘土,你将会注意到,不是街道上夹杂沙粒的灰尘,而是房间里那种棕色的绒状尘土。这说明帽子大部分时间是挂在房间里的,而另一方面衬里的湿迹很清楚地证明戴帽子的人经常大量出汗,所以不可能是一个身体锻炼得很好的人。可是他的妻子——你刚才说过她已经不再爱他了。这顶帽子已经有好几个星期没有掸掸刷刷了。我亲爱的华生,如果我看到你的帽子堆积了个把星期的灰尘,而且你的妻子听之任之,就让你这个样子去出访,我恐怕你也已经很不幸地失去你妻子的爱情了。”
赢得德州扑克人机大战的人工智能程序在辅助决策方面有不错的潜力,但与一次成功的商务谈判所需的人类智慧相比,还是太初级了。
这种学习技术的基本思路就是将计算机在一个领域取得的经验,通过某种形式的变换,迁移到计算机并不熟悉的另一个领域。比如,计算机通过大数据的训练,已经可以在淘宝商城的用户评论里,识别出买家的哪些话是在夸奖一个商品好,哪些话是在抱怨一个商品差,那么,这样的经验能不能被迅速迁移到电影评论领域,不需要再次训练,就能让计算机识别电影观众的评论究竟是在夸奖一部电影,还是在批评一部电影呢?
接下来,发明和使用负数一下子让人类对世界的归纳、表述和认知能力提高到了一个新的层次,人们第一次可以定量描述相反或对称的事物属性,比如温度的正负、水面以上和以下等。引入小数、分数的意义自不必说,但其中最有标志性的事件,莫过于人类可以正确理解和使用无限小数。比如,对于1=0.999999…这个等式的认识(好多数学不好的人总是不相信这个等式居然是成立的),标志着人类真正开始用极限的概念来抽象现实世界的相关特性。
计算机所使用的二进制数字、机器指令、程序代码等,其实都是人类对“计算”本身所做的抽象。
用“白马非马”之类的思辨来探讨具象与抽象间的关系呢?
人工智能界,少样本学习、无监督学习方向的科研工作,目前的进展还很有限。但是,不突破少样本、无监督的学习,我们也许就永远无法实现人类水平的人工智能。
只有从建立物体的运动定律开始,用数学公式表述力和质量、加速度之间的关系,到建立万有引力定律,将质量、万有引力常数、距离关联在一起,至此,我们的物理学才能比较完美地解释两个铁球同时落地这个再简单不过的现象。而计算机呢?按照现在机器学习的实践方法,给计算机看一千万次两个铁球同时落地的视频,计算机就能像伽利略、牛顿、爱因斯坦所做的一样,建立起力学理论体系,达到“知其然,也知其所以然”。
而计算机呢?按照现在机器学习的实践方法,给计算机看一千万次两个铁球同时落地的视频,计算机就能像伽利略、牛顿、爱因斯坦所做的一样,建立起力学理论体系,达到“知其然,也知其所以然”的目标吗?显然不能。
人的常识,是个极其有趣,又往往只可意会、不可言传的东西。
“即使两岁孩童也能理解直观的物理过程,比如丢出的物体会下落。人类并不需要有意识地知道任何物理学就能预测这些物理过程。但机器做不到这一点。”。
“两点之间直线最短”在地球表面,会变成“通过两点间的大圆弧最短”
科幻小说《三体》用黑暗森林理论来解释费米悖论。而费米悖论的另一种符合逻辑的解释就是,人类其实只不过是更高级别的智慧生物养在VR实验室里的试验品而已,人类的所谓自我意识,也许不过是“上帝”为了满足我们的虚荣心而专门设计的一种程序逻辑。
审美能力明显是一个跨领域的能力,每个人的审美能力都是一个综合能力,与这个人的个人经历、文史知识、艺术修养、生活经验等都有密切关系。
我们也将这一类作品称为“深度神经网络之梦”。网上有一些可以直接使用的生成工具,比如,有兴趣的读者可以试一试Deep Dream Generator(deepdreamgenerator.com)。牵强一点儿说,这些梦境画面,也许展现的就是人工智能算法独特的审美能力吧。
从工业革命到文艺复兴
·发展的代价是什么?在伊安·戈尔丁教授看来,今天这个时代与发生在欧洲14世纪中叶到16世纪的文艺复兴与启蒙运动非常相似。例如,信息技术的发展不但是今天世界的科技主题,其实也是14世纪到16世纪间欧洲思想解放、文艺发展的根本原因之一。当年,以谷登堡印刷机为代表的信息传播技术迅速将科技、文学与艺术知识推广到欧洲的每一座中心城市,这与今天的互联网普及有异曲同工之妙。
从科学和技术的角度来说,我们充满能力。但是我们的政治系统,全球的政治结构、宗教机构等,都还停留在20世纪50年代,进化的速度出奇地缓慢……所以,在这个‘发现的时代’,我们应该重新设置我们的头脑地图、政治地图、经济地图。”。
伊安·戈尔丁教授将科技与文艺复兴和思想启蒙联系在了一起。这为我们认识人工智能等未来科技提供了一个新的视角。
将今天这个时代称为人类历史上的第二次文艺复兴也许就是恰如其分的。当哥白尼用日心说改变人类对天体运行的认知,与旧的世界彻底决裂时,今天的人工智能技术也正在彻底改变人类对机器行为的认知,重建人类与机器之间的相互协作关系;当哥伦布在大航海时代里第一次站在新大陆的土地上,用航海大发现重构整个世界的地理与政治地图时,今天的人工智能技术也正在用史无前例的自动驾驶重构我们头脑中的出行地图和人类生活图景;当达·芬奇、米开朗琪罗等人用划时代的艺术巨构激发全人类对美和自由的追求时,今天的人工智能技术也正在机器翻译、机器写作、机器绘画等人文和艺术领域进行大胆的尝试……
AI会让人类大量失业吗?
一项本来由人从事的工作,如果人可以在5秒钟以内对工作中需要思考和决策的问题做出相应的决定,那么,这项工作就有非常大的可能被人工智能技术全部或部分取代。
自动驾驶:AI最大的应用场景
再如,一辆汽车在路面上可以通过自己的传感器发现另一辆汽车的故障,及时通知另一辆汽车停车检修。未来的道路也会按照自动驾驶汽车的要求来重新设计,专用于自动驾驶的车道可以变得更窄,交通信号可以更容易被自动驾驶汽车识别。在自动驾驶时代里,人们可以把以前驾驶汽车的时间用来工作、思考问题、开会、娱乐。
针对未来的自动驾驶技术,对现有道路进行改造升级,这又将涉及庞大的固定资产投资和相关产业的升级。
今天全球汽车工业的整车销售总额大约是2.7万亿美元,售后服务销售额大约是7200亿美元,共享经济等新兴业务的销售额只有约300亿美元。而到了2030年时,前两项业务的销售额将稳步增长,而由自动驾驶技术驱动的新兴业务的销售额将大幅增长到1.5万亿美元,成为刺激汽车工业增长的最大因素
从机器辅助人类驾驶开始,逐渐过渡到人类辅助机器驾驶,最终实现无人驾驶,才是理性和正确的选择。
“飞行汽车”初创公司Zee.Aero和Kitty Hawk
但在SAE定义的第3级技术标准中,监控路况的任务由自动驾驶系统来完成。这个差别是巨大的。技术人员也通常将第2级和第3级之间的分界线,视作“辅助驾驶”和“自动驾驶”的区别所在。
英国议会就于1865年通过了一部《机动车法案》。这部法案后来被人嘲笑为“红旗法案”。法案规定,每辆在道路上行驶的机动车必须由三个人驾驶,其中一个必须在车前面50米以外做引导,还要用红旗不断摇动为机动车开道,并且速度不能超过每小时4英里。结果,直到1896年“红旗法案”被废止前,英国对汽车技术的研发几乎还处于停滞状态,这个法案在英国汽车发展史上起到了极其愚蠢的负面作用。
自动驾驶将是中国未来10年科技发展面临的最重要的机遇之一。中国有全球最大的交通路网、最大的人口基数,自动驾驶的大规模商业化和技术普及反过来会促进自动驾驶相关科研的飞跃式发展。这种从科研到应用,从应用再反馈到科研的良性循环,正是中国能否在未来10年内,建立起世界先进水平的人工智能科技体系的关键。
智慧金融:AI目前最被看好的落地领域
判断人工智能技术能在哪个行业最先引起革命性的变革,除了要看这个行业对自动化、智能化的内在需求外,主要还要看这个行业内的数据积累、数据流转、数据存储和数据更新是不是达到了深度学习算法对大数据的要求。
计算机自动将摄像头采集的用户脸部图像与用户预存的照片进行比对,以确认用户的真实身份。银行各办公网点则可以利用新一代人脸识别技术,对往来人员进行身份甄别,确认没有坏人进入敏感或保密区域。
基于深度学习的人工智能技术可以基于多来源、多维度的大数据,为银行潜在客户进行精准画像,自动在高维空间中,根据潜在客户曾经的购买行为、个人特征、社交习惯等,将潜在客户分为若干种类别,并为每一种类别的潜在客户匹配最适合他们的金融产品。
在国内,蚂蚁金服已成功将人工智能运用于互联网小贷、保险、征信、资产配置、客户服务等领域;智融金服利用人工智能风控系统已经实现月均120万笔以上的放款,常规机器审核速度用时仅8秒;招商银行的可视化柜台、交通银行推出的人工智能机器人“娇娇”等则在智能客服领域做出了早期的尝试和探索。
用钱宝之所以能在保证风险可控的情况下高速增长,最关键的秘密只有一个——用机器学习技术自动分析包含大量强特征和弱特征的数据,自动判断交易风险。传统信贷风控经常使用一种叫作“风险评分卡”的数学模型,这个模型依赖于大量以非0即1的形式存在的强特征,综合计算一个客户的风险等级。这样的传统数学模型考虑的因素少,对现实风险的拟合非常简单,难以直接迁移到强特征不明显的互联网金融客户上。
这样的传统数学模型考虑的因素少,对现实风险的拟合非常简单,难以直接迁移到强特征不明显的互联网金融客户上。如果把一个人的数据比作一座冰山,那么强特征数据仅是冰山的一角,之下还存在海量的弱特征数据,例如电商数据、设备数据、位置数据、行为数据等。同时,作为百业之母的金融行业与整个社会存在巨大的交织网络,本身沉淀了大量有用或者无用数据,其中包括各类金融交易、客户信息、市场分析、风险控制、投资顾问等。这些数据单位都是海量级,且大量数据又以非结构化的方式存在,无法转换成传统模型可有效分析的数据。
语音识别,不就是听见啥输出啥,一个听写机器而已嘛。符号语言学的方法在语音识别上派不上用场,统计学方法大放异彩,那完全是因为问题本身就不属于高级智能的范畴。机器翻译?那可是要理解原文语法、语义,然后转换成目标语言的语法、语义的。论智能程度,语音识别是两三岁孩子的水平。跨语种翻译?那可是许多翻译大家皓首穷经,一辈子也难以企及的高远境界。这玩意儿绝对算得上是高级智能,是人类智慧的精华,要用计算机来解决翻译问题,非得懂得人类思想方法,懂得语言学不可。
智慧医疗:AI将成为医生的好帮手
在专利数据库、医疗数据库、化学数据库中的专利、数据、技术资料,以及发表在医药学期刊上的论文,通过机器学习来寻找潜在的可用于制造新药的分子式或配方。为了更好地将人工智能与医药相结合,这家初创公司甚至还设置了一个“首席医药官”(CMO, Chief Medical Officer)的职位。
AI可以在几周内阐明突出的关联,提供新的想法,而人类要想取得同样的成果,可能会穷尽毕生之力。”
让一个卷积神经网络分析了将近13万张临床上的皮肤癌图片,这个数字比现在最大的研究用图片集高出了两个数量级。在大量学习资料的支持下,这个神经网络迅速成为一名皮肤癌方面的专家。
艺术创作:AI与人类各擅胜场
从算法上说,智能机械手为我作画时,电脑所做的事情包括采集我的面部影像,用人工智能算法将影像与电脑事先学习过的某一种绘画风格关联起来,利用一种叫作“风格迁移”的技术,将我面部的每一个特征映射到一种特定的表现手法,并最终计算出画笔的移动方位和运笔力度,以完成最终的肖像画创作。
人类将如何变革?
但即便是在共和体制的现代社会里,高效的经济运行机制仍然需要这种自上而下,层层分解工作,层层授权的金字塔型分工结构。迄今为止,唯一能稍微改变这种金字塔构型的现象,是在发达国家中可以观察到的中产阶级数量的增长和蓝领工人的减少,这让金字塔最下面两层的人数比例不再呈现绝对化的梯形关系,而是有可能融合为一个更大的人群。
尤瓦尔·赫拉利在《未来简史》中说:“研究历史,就是为了挣脱过去的桎梏,让我们能看到不同的方向,并开始注意到前人无法想象或过去不希望我们想象到的可能性。……研究历史并不能告诉我们该如何选择,但至少能给我们提供更多的选项。”。
在现代商业体系中,处于金字塔顶层的政治家、经济学家为整个经济活动的总体战略布局指示方向——这个人群的数量最少;处于稍下层的企业家们,则在尽可能地利用互联网时代的全球化经济体系,设计最符合自身企业需求的商业模式——这个人群的数量稍多;企业里的中层管理者则起到承上启下的作用,在实际执行过程里既负责监控执行效果,又负责制定具体执行策略,实施人员管理(互联网和流程自动化的普及让这个中层的管理结构趋于扁平,使每个中层管理者可以管理更多的员工,或监控更复杂的流程)——这个人群的数量相当大,在中国也许有数千万人;而更多的人则投入到每一项具体的工作任务中,包括产品的生产制造者,技术的研发者,商品的运输者(想想我们在淘宝轻松购物的背后,有千千万万的快递骑士每天奔波于每个城市的街头)——这个人群在中国有好几亿人。这种社会体系顺利运行的基石就是分工协作,从最复杂的脑力劳动,到简单的、重复性的脑力或体力劳动,分别由数量不同的人群承担。
因为优秀的人才总能快速学会另一项技能,或快速适应新的岗位。
大时代,大格局
这个研究项目组包括17名成员,由人工智能学术界、公司实验室,以及产业界的专家与了解人工智能的法律、政治科学、政治及经济方面的学者组成。他们计划在持续至少100年的时间内,跟踪和预测人工智能产业的发展。《2030年的人工智能与生活》是这个百年计划发布的第一份报告。斯坦福大学这份报告首先列举了当前的人工智能热门研究领域,包括大规模机器学习、深度学习、强化学习、机器人、计算机视觉、自然语言处理、协同系统、众包和人类计算、算法博弈理论与计算机社会选择、物联网(IOT)、神经形态计算等。
并开发用于设计与伦理、法律和社会目标一致的人工智能研发方法。
研究人员需要开发高质量数据集和环境,并使可靠访问高质量数据集以及测试和培训资源成为可能。
还有一个重要原因就是要以谷歌大脑为基础,建立一个面向人工智能时代的新技术平台。在这个平台上,基于深度学习的谷歌大脑是驱动引擎,几乎每一家Alphabet旗下的子公司都像是安装了这一引擎,在不同赛道上飞驰的赛车。这里面既有人工智能驱动的生物医疗项目Calico,也有智能家居项目Nest,既有曾风光无限的自动驾驶项目Waymo,也有面向智慧城市的Sidewalk Labs。当然,Alphabet旗下最能带来现金收益的龙头老大,还要数早已将人工智能作为核心竞争力的搜索与移动互联网巨头——谷歌。
Facebook宣布,贾扬清的技术团队基于Caffe开发了一个基于移动设备的深度学习框架Caffe2go,首次在运算能力受限的手机上实现了实时的图像与视频捕获,以及后续基于深度学习的分析、处理。
谷歌在过去的几年时间里,连续开源YouTube 8M、Open Images、AudioSet等包含数百万份视频、图片、音频的标注数据集,为人工智能领域的科研发展提供“原材料”
Facebook这样的大企业很难主动开放那些关乎它们核心业务的网页标注、结果排序的特征、用户点击次数、广告转换指标等,对这些数据的垄断将AI世界里的大数据海洋分割成了一个个相互隔离的区域。
更多地鼓励利用区块链技术管理数据和信息流动,从技术和制度双方面打破科技巨头对大数据的垄断。
AI创业是时代的最强音
有兴趣的读者,可以从CB Insights发布的前100家人工智能初创企业名录[插图]中,寻找一下美国当下人工智能创业的趋势和脉络。英国是另一个人工智能创业的乐园,研发AlphaGo的DeepMind就是一大批英国AI创业明星中的代表。2017年1月,我和伦敦市长萨迪克·汗(Sadiq Aman Khan)讨论英国人工智能创业氛围时了解到,英国之所以在人工智能创业领域独具特色,主要是因为英国有足够优秀的人工智能科学家,在科研领域处于世界顶尖水平,但在资本、市场等大环境上,英国仍无法与美国相比,这是包括DeepMind在内的许多英国创业团队都被美国公司收购的原因。
有兴趣的读者,可以从CB Insights发布的前100家人工智能初创企业名录[插图]中,寻找一下美国当下人工智能创业的趋势和脉络。
中国的人工智能创业几乎与世界同步。根据《乌镇指数:全球人工智能发展报告2016》的统计:人工智能领域,美国与欧洲投资较为密集,数量较多,其次为中国、印度、以色列。美国共获得3450多笔投资,位列全球第一;英国获得274笔投资,位列第二;中国则以146笔投资位列第三。美国人工智能企业总数为2905家,全球第一。仅加州的旧金山/湾区、大洛杉矶地区两地的企业数量即达到1155家,占全球的19.13%。中国人工智能企业数量虽不及美国,但在北京、上海、深圳三大城市,也集中了一批高质量的人工智能团队。
下一次生产率革命的关键是“自动化”,而人工智能正是帮助现有流程实现自动化的最好工具。
第二阶段,随着感知技术、传感器和机器人技术的发展,AI会延伸到实体世界,并率先在专业领域、行业应用、生产力端实现线下业务的自动化。
AI商业化的核心目标是创建全面自动化的人类生活方式。
我们目前正在进入AI商业化的第一个阶段,也许只需要3年左右的时间,AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段,要花五六年、六七年的时间才能充分发展起来。而标志着全面自动化的第三阶段,也许需要十几年或更长的时间。
也不能仅看数据记录的个数,还要看每个数据记录的特征维数,特征在相应空间中的分布情况,等等。
今天,一个典型的深度学习任务,通常都要求在一台或多台安装有4块甚至8块高性能GPU芯片的计算机上运行。涉及图像、视频的深度学习任务,则更是需要数百块、数千块GPU芯片组成的大型计算集群。在安装了大型计算集群的机房内,大量GPU在模型训练期间发出远比普通服务器多数十倍的热量。许多机房的空调系统都不得不重新设计、安装。在一些空调马力不足的机房里,创业团队甚至购买了巨大的冰块来协助降温。
AI是中国创新、创业的最好机会
《IEEE模式分析与机器智能汇刊》(IEEE Transactions on Pattern Analysis and Machine Intelligence,简称PAMI)。
相关的三维图形学研究,会慢慢由纯粹的图形学问题逐渐演变为使用人工智能算法理解空间结构等AI问题。
AI时代该如何学习?
在线课程、讨论小组、实习实践、自我探索和自我完善将成为今后教育的主流模式。
形式分析、实证分析、多元模式交流、复杂系统四大课程板块。形式分析主要用于训练学生精密、合理思考的能力;实证分析重在培养创造性思维和解决实际问题的能力;多元模式交流则关注使用不同方法进行有效交流的能力;复杂系统重点在于复杂环境中的有效协作。
·关注启发式教育,培养创造力和独立解决问题的能力:被动的、接受命令式的工作大部分都可以由机器来替代。人的价值更多会体现在创造性的工作中。启发式教育在此非常重要。死记硬背和条条框框只会“堵死”学生灵感和创意的源头。·虽然面对面的课堂仍将存在,但互动式的在线学习将愈来愈重要:只有充分利用在线学习的优势,教育资源才能被充分共享,教育质量和教育公平性才有切实保证。
学生要从学习的第一天起,就和面对面的或者远程的同学(可以是人,也可以是机器)一起讨论,一起设计解决方案,一起进步。
兴趣就是那些比较有深度的东西。
AI时代该学什么?
这些技能中,大多数都是因人而异,需要“定制化”教育或培养,不可能从传统的“批量”教育中获取。
今天许多人满足于学习一种编程语言(比如Java)并掌握一种特定编程技能(比如开发Android应用),这样的积累在未来几乎一定会变得价值有限,因为未来大多数简单的、逻辑类似的代码一定可以由机器自己来编写。人类工程师只有去专注计算机、人工智能、程序设计的思想本质,学习如何创造性地设计下一代人工智能系统,或者指导人工智能系统编写更复杂、更有创造力的软件,才可以在未来成为人机协作模式里的“人类代表”。
人类的特长在于系统设计和质量管控,只有学习更高层次的知识,才能真正体现出人类的价值。这就像今天的建筑行业,最有价值的显然是决定建筑整体风格的建筑师以及管理整体施工方案的工程总监。他们所具备的这些能够体现人类独特的艺术创造力、决断力、系统分析能力的技能,是未来最不容易“过时”的知识。
学习文艺创作技巧,用人类独有的智慧、丰富的情感以及对艺术的创造性解读去创作文娱内容,显然是未来人类证明自己价值的最好方式之一。
作家、音乐家、电影导演和编剧、游戏设计师等,一定是人工智能时代的明星职业。
包括创造性、情感交流、审美、艺术能力,还有我们的综合理解能力、我们把很多碎片连成一个故事这样的讲述能力,我们的体验。所有这些在我们看来非常不可靠的东西,其实往往是人类智能非常独特的能力。
AI时代的教育要关注什么?
却忽视了工作背后潜在的社会价值。
我们过去专注于培养数理化人才,为了训练符合上个时代需求的工程师、医师、会计师、律师等专业人才,我们已经投资庞大的社会资源,导致很多人从学习阶段起就开始偏离了他们的核心潜能而毫不自知。人们将从人工智能时代的大变革、大演进中被释放,真正投入我们擅长、我们热爱的领域。
有了AI,人生还有意义吗?
人类必须不断思索自身存在的价值,寻找生物特征以外的生命意义。
因为他知道自己要死亡以及宇宙对他所具有的优势,而宇宙对此却是一无所知。因而,我们全部的尊严就在于思想。”
不断提高自己,善于利用人类的特长,善于借助机器的能力,这将是未来社会里各领域人才的必备特质。
成为在情感、性格、素养上都更加全面的人。
因为我们全部的尊严就在于思想。