一线|百度CTO王海峰称,昆仑芯片将在今年下半年推出

腾讯新闻《一线》张珺
4月19日,百度CTO王海峰在博鳌亚洲论坛现场接受了腾讯新闻在内的4家媒体访谈。王海峰在采访中对百度人工智能历史、现状、商业化等问题进行了回答。王海峰说,百度人工智能在过去11年有三个重要节点,它完成了从布局人工智能技术到深度学习再到开放的过程。
他认为AI作为第四次工业革命的核心驱动力量,现在还处在早期。在应用过程中,会面临各种各样技术、产业,甚至伦理规范、法律法规上的问题,是一个逐渐完善的过程。
他以电为例,墙上有插头,如果普通用户没有安全意识,直接用手触电也是问题。“所以这个实际上是全社会共同努力的结果。”
今年3月,百度昆仑芯片业务完成了独立融资,投后估值约130亿元人民币。王海峰在采访中称,昆仑芯片2将会在下半年推出。“芯片这个行业,整个全流程下来,的确还是有一定的不确定因素,我很难告诉你具体是某一天,但是下半年我们应该会推出。”王海峰说。
以下是部分采访摘录:
Q:从2010年百度开始做人工智能,也刚好你加入百度的11年。百度人工智能在过去11年有哪些重要节点,你会怎么划分发展阶段?
A:我是2010年初加入百度,那时候我们开始逐渐布局,前几年更多是布局人工智能技术。2010年先布局了自然语言处理、机器翻译,后来逐渐到语音、视觉,然后机器学习、数据挖掘、知识图谱等一系列人工智能技术。早两年还是用统计机器学习的方法在做。
第一个相对重要的关键节点是2011年底到2012年初,我们开始尝试研究深度学习,并且应用深度学习。我最开始关注深度学习是2011年的下半年,然后从2012年初尝试在语音识别上用深度学习,后来陆续在图像识别上,进而到语言的翻译上方方面面。
布局了若干年之后,下一个很重要的点是我们把所有技术,早期主要用在百度自己的这些产品,比如搜索、地图、翻译等等。然后到2016年我们正式对外开放,那时候是百度大脑1.0,然后包括飞桨,PaddlePaddle也是那时开源开放的。开源开放以后,意味着不仅仅是应用于百度内部的产品,而开始向外输出,发展到现在百度大脑6.0,它是软硬一体的AI大生产的平台,AI的基础设施。我们希望它能支撑所有的开发者、所有的合作伙伴、客户,各行各业,基于这样的平台来开发自己的业务。
Q:你负责的百度AIG事业群,需要支撑的业务特别多。百度所有业务背后都有你们的影子,不管搜索、信息流,还是车,人工智能技术又特别多,你的时间分配是什么样的?有没有优先级?
A:谈不上优先级。的确我们技术中台是服务公司所有业务,这时候怎么支持业务呢?百度从2013年就做平台化,当时成立平台化委员会,我是百度平台化委员会的第一任主席。平台化的目的就是发现很多技术是有共性的。
比如说像这些人工智能技术,像自然语言语义理解显然很多业务都可以用,那每个业务自己开发一遍,效率低,而且重复建设。我们就把它平台化。平台化以后,变成了对于大多数应用来讲,直接调用平台上的技术能力,就可以满足业务需求了。满足不了的,我们再针对它的需求做一些定制化开发。定制化开发一方面满足了业务需求,另外一方面我们把定制化开发的技术产生的成果再沉淀回平台,又平台化出来,后续又可以用。所以现在整个技术中台对业务的支撑一大半都是通过平台化,不需要找技术团队人专门定制就已经完成了,一小部分在做定制化。
我个人的精力,因为我还是做一个技术出身的人,我还是会花不少精力做技术。一方面做具体的技术,同时作为CTO看整个公司技术的发展方向、技术布局、技术应用,也在管理智能云的业务。
Q:最近关于AI话题已经转移到了产业化实践,百度在几年前已经布局,能不能分享一下百度飞桨AI开放平台和自动驾驶方向百度的产业实践?
A:飞桨呢,我们最开始做主要做框架,像TensorFlow、Pytorch其实也是框架,框架核心呢,一个是开发我们讲的是要开发便捷,像百度飞桨同时支持静态图,和动态图,这个开发者用起来非常方便。
另一方面,其实框架最核心的是超大规模训练,我们是世界上最早能支持万亿级训练的,这是一个最核心的东西。训练出来的模型就是要在不同平台上进行部署,所以我们做多端、多平台的,从服务器到手机,到各种嵌入式设备,然后要跟各种芯片进行适配等等。做了这个以后,这个基础有了,这个基础非常重要,当我发现只有这个还不够,真正能基于这样一套框架,即使框架是很方便应用的,真正基于这个框架直接做开发的人毕竟很少,我们要把框架发展成整个平台,这就是我们现在讲飞桨深度学习平台。平台除了这些基础框架以外,更多是降低使用门槛,这个门槛我要提供更方便的各种组件,各种工具。
比如说一个自然语言处理的应用,一个开发者可以不基于我的底层框架从头开始开发,而是我已经做好了这样一个库,直接调用这个库就可以应用了,我们要提供非常丰富的模型库,这个也是飞桨非常重要的特色。有了模型库以后,进一步开发者使用的时候,还需要一些开发套件,工具组件都会提供。
还有一个很重要的就是,各行各业的人都来用,用的时候很多人其实原来并不熟悉这个领域,需要学习,需要训练,所以我们提供了一个AI studio这样的一个实训平台可以在上面去学习,我们讲五年培养五百万的AI人才,那我的经验就是,我们要有核心技术,更要从应用的角度,从开发者的角度,从生态的角度考虑他们要什么,我们提供一个丰富的完整的平台,这时候才能推动他更快的发展,更广的应用。
Q:你认为AI在产业化目前面临哪些瓶颈或者困境?
A:应该说AI作为第四次工业革命的核心驱动力量,现在还处在早期。我们知道人类的一次工业革命往往是几十年甚至上百年的过程,现在还处在早期,谈不上特别某一个点是最困难的,应该说所有在应用过程中,会面临各种各样技术上、产业上的甚至伦理规范、法律法规方方面面都是在一个逐渐进步、逐渐完善的过程。
Q:百度人工智能目前是否有可规模化商业化的场景?
A:其实现在已经在商业化了,2C的我不说了,2B的呢,像我们讲百度云,我们叫百度智能云。之所以叫智能云就是区分于以前的这种以算力为主的云计算,现在更多是我们对外赋能,实际上是带着AI的能力。所以百度智能云的战略和别人说法也不一样,去年我对外发布的叫“以云计算为基础,以AI为抓手,聚焦重要赛道”。这三句话,第一句话很好理解,一方面云计算本身的确是很大的产业,有很大需求。而且云计算提供的算力也是AI发展和应用一个很重要的基础,所以这是以云计算为基础。
而百度的特色是AI,而且是全栈的AI能力,所以我们的客户往往需要的不仅仅是我们基础的云计算。比如说计算、存储、带宽能力,同时需要我们的AI能力。就像我们的昆仑芯片,提供了算力,但实际上跟飞桨有一个非常好的结合,它俩一起提供给客户会有非常好的效果。
其实百度智能云已经应用于不少行业了,应该说现在各行各业可能都有,从我们熟知的工业,农业,交通,医疗,教育,能源等等,各行各业其实已经都在用。如果说商业化,那这些行业客户的确也是给我们付钱的。
Q:百度集团对于AIG的要求是什么?有商业化的OKR的吗?
A:对于技术中台来讲,我们核心任务就是支撑全公司的所有业务发展。然后对于各个业务毕竟它有这些收入的目标。
Q:你前年9月接手百度云,你对百度云具体带来了什么变化?
A:如果一句话回答就是,我重新梳理百度智能云的战略,制定了我说的“云计算为基础,AI为抓手,聚焦重要赛道”的战略。在战略指引下我会重新梳理从业务架构到组织架构,各个方面都会围绕着这个战略发生很多变化。
Q:百度芯片业务今年完成了融资,昆仑2的量产有具体时间点吗?
A:昆仑1已经上线,昆仑2,如果说具体时间表,因为这个行业,芯片这个行业,整个全流程下来,的确还是有一定的不确定因素,我很难告诉你具体是某一天,但是下半年我们应该会推出。
芯片是这样,首先芯片本身就具有独立的商业价值,尤其这样一款跟飞桨这种有广泛影响的平台结合起来这样的一款芯片,实际上还是有它的价值。另外一方面从对智能云来讲,也会为智能云提供更好的基础算力的支撑。
Q:未来五到十年,是人工智能很大的一个红利变现期,在这个大规模红利变现期到来之前,在伦理和治理上,有哪些限制因素?
A:这是一个社会各界共同努力的、要大家一起去解决的问题。我们会把人工智能认为它是人类第四次工业革命的一个核心的驱动力,那么我们看到之前的第一次工业革命给人带来了机械,第二次带来了电,第三次带来了信息技术。比如我们以电为例,电现在我们都知道,是现在生产生活人们生活中不可缺少的,但实际上电也涉及到治理问题。如果治理不善也会带来危险,带来伤害。
其实人工智能,或者任何一个技术都是这样的,而这个治理是需要各方面的,比如从技术角度,我们要保证技术的安全性,数据的安全性,稳定性,模型的安全性等等这些都要保证。那么从治理的角度呢,政府肯定是要从法律法规标准等等这些方面主导,行业呢一方面在应用这些技术,开发自己产品的时候要考虑产品的安全性问题,考虑它给人类更多带来帮助,而不是带来伤害。从公众的角度,也需要一个对技术以及技术所产生的产品,逐渐有一个正确的认知。
比如电,墙上有插头,如果我作为普通用户,我没有任何这方面的安全意识,直接用手触电也是问题,所以这个实际上是全社会共同努力的结果。