对话 | 盖世汽车CEO、盖世汽车资讯部总编 周晓莺
撰文 | 盖世汽车编辑 熊薇
以下为采访实录:
上期内容见音频栏目上期
UniAD真·端到端:感知决策一体化的通用模型,图片来源:商汤绝影
周晓莺:就是虽然都叫端到端,中间还是有非常多的差异,回到大模型也一样,这两年特别火,包括汽车行业整车厂和技术公司也都在推自己的大模型,您怎么看待这个现象?
王晓刚:我觉得这是一个必然过程,大模型出现以后,大家都想去尝试。但未来一定会收敛,因为这对资源的投入要求非常高,并且需要不断追踪技术的发展。今天大模型的发展不是已经到了天花板,而是还处在一个快速发展的阶段,对投入要求非常高。
刚才提到算力,我们去年已经实现了1000P算力,等效于把3000块A100芯片连在一起进行大模型网络训练。今年我们的目标是实现3000P算力,等效于1万块A100连成一个集群用来训练网络,明年进一步达到10000P算力,整个基础设施是不断演进的。
但我们看今天很多做大模型的企业,可能只有100P或者几百P的算力,其实不具备这种原生态大模型能力,而是拿一些开源模型在上面做修改。这样一来,如果想做一些根本性的创新很难,而且这是一个持续投入的过程。
我们看过去十年人工智能的发展,2012年神经网络第一次在视觉里面取得比较大的突破,之后从AlexNet到AlphaGO,再到今天的GPT-4,算力需求已经增长了1000万倍,目前还在不断增长。在这种情况下,前面说既是短跑又是长跑,如果从长跑角度来看,不太可能每家车厂都构建自己的大模型,更多可能是找到这方面的合作伙伴,而且这个合作伙伴也需要在这条路上持续投入,持续创新,我觉得这恰恰是商汤绝影的机会。
在AGI领域,商汤本身就有很深的积累,同时我们也是非常坚定地持续往前走。未来,我相信整车厂能够意识到基础设施所带来的价值,到时候我们怎么能够更好地深入合作,什么是他们要做的,什么由我们来做,会慢慢清晰。
周晓莺:大家需要一个时间学习新东西,并且在定位上慢慢把边界区隔开,而不是什么都自己做。
王晓刚:尤其大模型发展很快,可能你上一代还没有100%达到别人的水平,别人下一个版本又出来了。
“整车厂迈向通用人工智能,商汤绝影希望成为核心供应商”
周晓莺:刚刚提到算力,原来燃油车时代是靠马力驱动,现在智能车时代靠算力驱动,咱们有预测过智能汽车变革对算力的需求上限吗?
王晓刚:今天还没有看到上限,我们知道人脑的神经元数量约为860亿个,如果把每个神经元的突触算上,相当于百万亿规模,今天还远远没有达到上限。所以可以看到,目前对算力的需求还在持续增加。
不过我觉得未来可能是“云端模型+离线模型+终端模型”的融合状态,汽车领域有望出现一个超级强的大模型,类似于今天的GPT-4,然后派生出若干个能部署在终端的小模型。在此过程中,随着算力提升,终端小模型的能力将逐渐增强。
周晓莺:商汤大装置现在算力是12000P,后面的算力规划能不能给我们讲讲?
王晓刚:今年底计划达到16000P,但这里面的规划其实滞后于需求。我们最早规划大装置的时候,算力是5000P,但实际需求很快就超过了当时的计划。所以说这个领域还是一个高速发展的状态,但有一点比较肯定,就是商汤作为人工智能平台性企业,在这些方面一定要抓住制高点。
周晓莺:过去两年我们也看到很多车企在组建智算中心,您觉得这个现象会持续吗?
王晓刚:组建智算中心投入非常大,还可能出现的一种情况是,智算中心刚建好发现规模不够用了。所以对算力的规划一定要留有冗余,用于弹性调度,这样的规模化才是最经济的。如果说每家公司都具备100P或者200P的算力,将来可能不仅不能解决自身问题,还会产生比较高的维护成本,从这个角度并不是一个经济的选择,可能选择合作更合适。
其实商汤原本也在各地组建了比较多小的算力中心,后来才统一汇聚到临港,实现像刚才说的万卡集群大算力,大家的任务可以充分调配我们的算力,达到一个最优使用情况。不然的话,想扩充算力规模的时候扩不出去,另外使用效率也不是很高。
周晓莺:它更像是一种新基建。
王晓刚:而且技术难度很高,当我们把10000块GPU连在一起的时候,中间只要一块GPU出现问题,或者硬件之间的连接出问题,都会对整个系统带来影响。现在商汤可以进行万卡互联的超大集群训练,且能够长时间稳定运行,一旦出现问题,异常检测速度已达到分钟级,能实现快速诊断并及时修复。这些都是我们这么多年训练AI大模型计算过程中积累的经验,如果每家公司自己去做的话,是不划算的。
周晓莺:人工智能某种程度属于科技非常顶端的技术,不仅研发投入大,回报周期也很长。而现在汽车行业竞争十分激烈,企业会面临很多选择,比如究竟要市场份额还是利润,对于商汤绝影来说,怎么看待在汽车产业商业闭环走的更久,能够更好盈利这件事情?
王晓刚:我们也还在探索当中,在汽车行业绝影非常年轻,还有很多东西需要学习。我们也从汽车行业引进了大量相关人才,一方面推进产品落地,加深跟客户的合作关系,另一方面对下一代技术提前布局。因为技术迭代非常快,可能这一代技术或产品抢到了市场份额,但又失去了下一代技术更新迭代的机会。所以我们看绝影的商业价值,也是放在商汤大背景下面,希望通过比较好的技术持续引领市场,而不是停留在某一个阶段。
周晓莺:从您的视野来看,现在中国智能汽车的发展和应用,包括大模型上车,您觉得在全球市场大概处于什么样的生态位?
王晓刚:发展肯定是非常快的,当然如果说美国的话,特斯拉肯定是行业标杆。除此之外我觉得国内过去几年的积累包括迭代速度,都体现出了比较强的竞争力。所以将来把我们这些智能化技术推向全球,也是很重要的一个点。
周晓莺:如果往后看三年,您对商汤绝影的发展有何期待?
王晓刚:从自身定位来说,面向未来AGI发展目标,我们希望能够助力整车厂和合作伙伴,去实现我们新的定位和价值。
本身绝影就是一匹千里马,需要能够跑的比较远,我觉得这是时代给了我们非常远大的目标,和充满想象力的空间。同时我们还要跟整车厂紧密合作,扎扎实实做好产品落地。今天市场竞争仍然非常激烈,我们希望能够做好产品交付,同时在行业里面持续引领创新。
希望三年以后绝影能够成为AGI时代整车厂走向通用人工智能非常重要的核心技术伙伴,非常核心的供应商。如果能够实现这点的话,我会非常高兴,我想商汤也非常高兴实现我们的目标。
周晓莺:我们也非常期待商汤绝影在接下来的发展中,像千里马一样跑得越来越快。
彩蛋
周晓莺:您小时候就是学霸,中科大的少年班,后来从学术到产业会有不适应吗?
王晓刚:各种调整吧,我刚来公司的时候,汤老师说你只要管好技术就行,不需要负责管理。但后来其实发现,如果不懂技术也管不了人,而不懂管理,也形成不了落地的结果,因为还是结果为导向。
我刚到商汤的时候并不管业务,后来需要负责一些具体业务,商务收入指标,各方面要求还比较高。但我觉得这也是商汤的选择,公司发展需要你变成一个什么样的人,能够随着发展快速做出调整。
另一方面,这个转变对我来说还是非常感恩,我非常珍惜这个转变。因为人工智能发展非常快,待在学校里很多事情做不了,要资源实现AI落地。十几年前我们做AI研究都是停留论文上,2004年我们发表了五篇CVPR,那时候中国很少有人能做到。但今天不一样,论文很多,甚至都用ChatGPT来写论文。
周晓莺:生产工具不一样。
王晓刚:但要形成影响力的话,在产业里面把AI落地是非常重要的点。从培养人才来说,以前我就带十几个博士生,每年有几个人毕业。但到了商汤,我们这几年培养了几千人。
对人才的培养,底层其实还是要实现技术突破,让技术产生社会价值,同时也能培养人,底层逻辑是一样的。但这里面实现的方式不一样,从原来的学术背景到今天的产业界,风格各方面都不一样。
但这里面我也能体会到自己的优势,比如说管理,他们之前给我上了很多管理课,最终我发现精髓就两个字:信任。这个和我以前做老师,背后的核心逻辑是相通的,可能表面看着有很多不一样,但做事、管理不可避免会带着原来的背景,也会做出不一样的事情。
其实不光是我,汤老师以前做这些事情,能够实现超出行业引领性的东西,因为他原来也不是一个企业家。有时候思考维度、追求的东西不一样,反而能够做出一些引领性的东西出来。
周晓莺:您觉得在自己的发展经历当中,什么对您影响特别大?
王晓刚:那肯定是汤老师对我影响最大,我2001年本科毕业,那时连CVPR是什么都不知道,国外那些高水平研究、论文都没见过。到后面他创立商汤,要做公司,我说我们做研究挺好的,为什么要做公司,他一步一步把我们的人生轨迹改变了。
周晓莺:遇到一个好的老师,人生的引路人很重要。
王晓刚:2001年的时候,相当于中国AI研究从中国走向世界,原来就是自己搞,都不知道高水平研究是什么。2014年就是AI落地了,从写论文到产业落地,也是一个划时代变化。再到2021年汤老师做国家实验室,AI变成了国家的一个战略选择,一个责任。所以说每一步都有深刻意义,也是在那个时代背景下发生的事。
周晓莺:您对现在年轻人有什么好的建议吗?
王晓刚:最早汤老师给我们的要求就是要坚持原创、坚持创新,做别人没有做过、不敢想的事情,这在今天可能特别缺少。为什么会出现“百模大战”?ChatGPT出现之前没有“百模大战”,因为之前大家不知道能不能做出来,所以就不投入。一旦做出来了,大家觉得是确定的东西,都开始做同样的事情,重复消耗了很多资源。所以能够跳出这些思维,勇于担当去做一些新东西,并且能够坚持。