胡世亮是美国威斯康星大学博士,师从处理器架构专家James E. Smith,曾是英特尔未来科技研究小组中唯一的华人,研究范围涉及处理器内核的优化创新、多处理器的动态性能监测和优化、新的硬件支持以实现并行程序的调试排错(Debug)等,获得过十七项发明获专利。
然而,2016年他做出了一个令人意想不到的决定——放弃硬件研究,转而加入一家国内研究大数据处理技术的初创公司。什么原因促使胡世亮做出这样的选择?以下是对他的专访实录。
审时度势,职业发展紧跟技术发展趋势
问:能否分享一下你早年的经历,是如何加入英特尔的,当时负责哪些业务?
胡世亮:加入芯片业的龙头——英特尔公司,要从我留学攻读博士的生涯说起。
我在国内学的是软件专业,当时对硬件方向其实并不拿手。但是九十年代英特尔公司的迅猛增长和整个芯片业的风光无限让我毅然决定转行硬件。后来,我进入威斯康星大学攻读博士学位。威斯康星大学麦迪逊分校(U. of Wisconsin-Madison)的计算机体系结构从八十年代起开始崛起,此后称霸学术界三十年,对业界产生了深远的影响。彼时, Wisconsin的计算机体系结构正如日中天,我纵身跳入了这个强组,并成为中国留学生中加入这个集体的第一人。我有幸师从泰斗级大师James E. Smith,他是学界里数一数二的人物。我从大师身上学到的不仅仅是如何做科研,他正直严谨、谦逊低调、敏锐洒脱的处世之道也让我获益良多。
我在导师指导下从事基于X86的硬件-软件协同设计(Hardware/Software Co-Design)。作为标杆式的技术创新,我们联手提出了指令融合执行技术。当时的学界鲜有基于X86这样的学界研究平台(虽然X86已经占据的市场80%以上的份额),我就从开源的Bochs起家写了一个X86架构的微体系结构模拟平台出来,收集到和业界直接接轨的实验数据。我们的论文/报告很早就引起了英特尔公司的注意。所以还没毕业我就已经内定了加入英特尔的MRL( Microprocessor Research Lab)。MRL的主要任务是帮助产品部门研发未来需要做到微处理器中的新技术、新功能,我参与了一些优化指令执行,处理器架构重新设计预研,以及如何用硬件加速协助软件排错(Debug)的新功能研发工作。由于很多工作是前瞻性的,且有保密协议,所以就不多说了。
问:是什么原因和契机令你放弃英特尔的高薪工作,加入创业公司来从事大数据技术研究?
胡世亮:这是一个多元的,深刻的转变。
从技术层面来说,计算机体系结构方面近年来其实没有出现突破式创新了。这其中有很多原因,比如沉重的Legacy和产业的风险管理等等。而另一方面,传统的计算机体系结构的也确存在局限性。这些局限随着计算机系统的不断开疆拓域,应用渗透到我们的生活中的每一个角落,而日显弥彰。比如计算机在视觉,语言,甚至自我学习方面就很弱。在这些领域,一台传统的超级计算机不见得能胜算一个人类的小孩子。要想到,在数值计算方面,同样的这台超级计算机可以轻松击败全人类的总和计算速度。显然,我们的计算模式在不断涌现的新应用领域需要创新。
在Wisconsin时,我的导师和另外一个非常聪明、有远见的教授Mikko Lipasti就已经在探讨如何模仿人脑的运作方式去重新设计一套计算架构 ——仿脑计算(Neromorphic computing)。他们鼓励我们去读一些关于人脑思维的书籍。可惜那个时候出于现实的压力和这种研发的艰巨性及短期无果的风险,使得我们没有能够投入很多精力在这方面。而近年来,随着对于传统架构局限性的一再认知和对突破式创新的渴求,我们又开始关注起思路源于人类神经元式的计算模式。这种计算模式虽然还受限于我们对自己大脑运作的无知,但是一些简单的模仿,比如深度学习网,近来在图像,语音处理方面已经带来了一些技术突破。因此,抛下沉重的历史包袱,去自由发挥开拓创新,逐渐成为我的新技术层面理想。
而从职场生涯的角度来说,硅谷一直是个引领创新,朝气蓬勃的地方。撇开那些众多大牌的硅谷奠基公司们不说,近年来硅谷还是雨后春笋般地不断涌现了一批创新公司,为人们的生活带来巨大的提升和改变。比如优步,Airbnb等等。看着更年轻的后起之秀们不断攻城拔寨,打下自己的江山。我这个坐在大公司里的过着四平八稳生活的昔日才俊,也开始感到坐不住了,感觉需要出去闯闯了。毕竟大公司里的官僚机制有太多的牵制,维护运营一套传统的体系消耗着太多的光阴。我感觉到,这是再一次需要毅然纵身跳出的时刻了。
就在我东张西望的时候,我在Wisconsin读书时的老朋友,李云鹏,找到了我。介绍了他的大数据创业公司和他的团队。我认定人工智能在大数据领域将发挥越来越重要的作用,而这正是我近年来追逐的新技术方向,我感觉我们联手干,应该可以干出一番事业。所以我就毅然决定加入了。
瞄准细分市场,推出自主创新技术
问:你如何看待大数据市场未来的技术发展趋势和市场需求?
胡世亮:人类数据量的积累速度已经成功地接手了摩尔定律。大数据处理的难度还不单单在于数据量大,还体现在数据的多样性,多变性等等,此外许多大数据的应用还提出了要实时快速响应的要求。我们已经处在IT界一个重要的历史转折点,数据越来越多,越来越重要。先前以软件代码为重的时代将逐步转化到以数据为中心,数据驱动的时代。相呼应的,这样的量和质的指数级增长必然要求未来数据分析处理的高性能和智能化。天数科技就是在沿着这两个方向部署研发。短期内我们的技术要解决的是加速或者说提高数据分析处理的性能问题,长期的看,我们会进入数据智能化领域直达人工智能。
大数据的市场需求将是巨大的——数据可以帮助我们更加深刻地认识自己,和周围所有产生数据的事物。目前业界对于海量数据的存储和统计是已经有了比较完整的方案,但如何从数据中提炼出价值,就需要向智能化(人工智能/数据挖掘)演进。智能化后的数据可以帮助我们重演过去,预测未来,甚至发掘出我们的深层认识。根据最新的报道,图片网站Instagram已经可以通过用户上传的照片的色调来判断出患有忧郁症的人,其准确度超越了传统医生的诊断方式。可以预见类似这样的发现和智能应用以后还会不断涌现。
问:大数据领域的服务向来是巨头的天下,你和你的创业伙伴如何选择市场定位和切入点来避开与巨头的竞争?
胡世亮:的确,大数据已经火热了好几年了,各大网络公司都有自己的一套方案,服务和产品。但是大数据的市场潜力非常大。因为大数据技术本身就非常的复杂,带来的结果是市场也非常复杂,所以即使大数据概念已经流行几年了,但这个并不像在其他领域那样很快的出现了1-2家具有垄断性质的巨头。
天数科技的主要切入点是非传统网络大公司的客户,比如制造业企业,交通运输行业企业等等,这些企业需要数据业务(包括现在的大数据,甚至可以追溯到更久远的数据仓库)与各行业/企业有一个紧耦合的关联,这不是一朝一夕就能做到的。无论是在时间上,还是空间纵深上,这样的环境都为天数科技这样擅长于数据处理的底层加速技术、有很深的技术积累的初创企业留下了足够的余地去拓展市场生存空间。
我们的团队通过技术创新来大幅度提高数据处理的速度,提高数据处理的自动化,智能化。基于我们自研的Soft Silicon技术,并在此之上开发的数据挖掘平台和高速OLAP数据库。使用这些软件和平台,企业可以很方便的开发并部署他们的数据处理业务系统,这将使企业应用大数据技术的门槛大大降低,应用范围会大大扩张。通过将人工智能技术应用于大数据领域,我们也致力于通过大数据技术帮助一些企业实现生产,运营,服务的电子化和智能化,提升他们在全球化产业链中地位和效益。
问:你主导研发的Soft Silicon技术,与其他主流数据处理技术有何不同?能否举一些应用案例?
胡世亮:Soft Silicon是一种非常贴近硬件的系统软件优化技术。相对于硬件,软件是一个非常庞大生态系统,它的发展演进往往落后于硬件的推陈出新。比如,CPU的众多新指令,新功能往往很少能得到既有软件系统的充分利用。在摩尔定律下,现时代的计算机的内存越来越便宜,越来越大,固态存储替代传统机械硬盘,GPU的崛起,各种各样专用的或者比较通用的硬件加速器在不断涌现出来,天数科技的Soft Silicon技术就是一层自动帮助既有软件系统受益于新硬件平台的加速器。这种技术还可以和其他软件技术,例如分布式处理,结合产生更大的提速效应。
Soft Silicon 工作原理
基于Soft Silicon技术,我们开发了人工智能平台SkyDiscovery和数据基础软件SkyInsight,他们能够有效降低数据应用的开发难度,提升数据分析性能。在应用方面,我们正在为中国中车提供IT咨询及服务;同时也正在与中国铁道科学研究院合作,帮助他们进行一些数据整理挖掘分析的工作。还有许多的行业集成商、服务提供商和硬件厂商等企业在陆续与我们展开合作。
苦中作乐,技术宅的创业生活
问:能否介绍一下与你一起开发Soft Silicon 技术的团队伙伴们?你们是个怎样的团队?
胡世亮: 我们的技术团队是靠一些脊梁式的人物撑起来的。简单说两个人物吧:
公司副总裁蔡飞之前就是南京富士通一个带领数百人团队的事业部总经理,在南京本地人脉广泛,资源丰富,主管研发的他就是这个初创团队的哆啦A梦式的人物,什么问题麻烦都到他为止。另一位海归的技术骨干倪岭,他在甲骨文就是名声在外的资深数据库大牛,同样是被CEO李云鹏的召唤感动加入,毅然辞职回国加入天数。业务精通的他还拥有常人难及的精力,常常同时担任数个项目的技术要职,非常深刻的印证了比你牛的人还比你努力这句话。
众所周知初创公司的产品研发是紧张高效的。为了让团队成员不因为工作而影响了身体健康,公司非常贴心的准备了各种饮料水果,购置了健身器材,每周五下午我们还集体去奥体中心游泳打球。平日里团队的气氛也是紧张又不失活泼,比如午餐时间大家就在会议室集体观影追剧或者看看最新的综艺节目,每季度我们也会有员工的集体生日趴踢,贴心的CEO还不时弄来《非诚勿扰》的现场票并不断鼓动策划单身员工的脱光活动。虽然我们是个新创的小规模公司,但整体气氛已经是多年老友的感觉。我很欣赏这种氛围,这是公司和员工双赢的工作方式。
问:创业以来,你个人和公司面临的最大困难和挑战是什么?作为CTO在管理团队上你有什么心得?你更看中团队成员的哪些能力和特质?
胡世亮:事在人为,一个创业公司的成败关键往往在于其团队里的人,以及他们是如何合作的。我们已经有了一个相对齐全的,有能力,有视野而且团结合作的优秀团队,但是我们正处在快速成长阶段,也非常需要更多的人才加入我们,来一起打造出下一代,更快,更加智能化的大数据分析系统。
我们目前主要做两个方面的研发:一个方面的是软件系统层面的,通用的高性能数据分析系统;另外一个方面是新兴的智能大数据分析技术,例如机器学习,深度学习等等。这两个方面的人才在目前应用开发,网页设计人才更加普遍的环境下,是相对比较难找的。这是目前面临的棘手的困难和挑战。
我在南京招兵买马,找寻的是系统软件,比如操作系统,编译器,数据库,GPU编程,分布式计算等方面的开发人才,以及人工智能,机器学习,深度学习,数据分析方面的人才。如果感兴趣,欢迎通过邮箱联系我:husl@sky-data.cn
我认为创业的过程不仅仅是艰苦奋斗,更应该是一个互相帮助,教育,共同成长的团体打造过程。我们希望团队中每一个成员诚信有担当,都有多角度思维,互相支持,发扬团队精神,善于学习新事物,新技能。综合我们团队的经验积累和运作模式,一个聪明上进的年轻人,即使缺乏上述的一些技能,我们完全有信心可以把他培养成大数据行当的技术达人。
问:大数据、人工智能现在是热门领域,很多年轻程序员都希望在这些领域有所建树,你能否结合自己的经历给他们一些建议?
胡世亮:比起建议,我还是希望分享一些自己的做事原则和方式。
在海外求学和工作的这些岁月,如果说积累下什么经验,首先我会觉得独立思考是非常重要的精神,做科研的人不能盲目跟风,要能在自己的领域扎扎实实的潜心思索。另外也要永远保持开放性的态度,一是对任何新事物要全面了解,正面的负面的特征都要有所把握。因为没有什么技术是万能的,能用最简单的方式解决的问题就无需用更复杂的方式去解决问题。二是开放式的环境才是每个个体价值最大化的途径。作为技术出身的人才,除了自我学习钻研,要注意多参加一些学术活动,参加探讨,寻求合作,建立一个自己的人脉圈子,这些都是对自己的专长和职业前途非常有帮助的。