CN EN

二十年磨一剑 中国半导体迎来又一颗超新星

2021年12月12日

来源:半导体行业观察

作者:李寿鹏


随着云计算和人工智能等应用的兴起,数据中心芯片需求在过去几年迎来了新一轮的繁荣。这首先体现在对统治这个市场多年的x86 CPU需求的剧增。众所周知,自1995年推出Pentium Pro以来,英特尔Intel所主导的x86 CPU就在服务器芯片市场大力扩张,并最终一统天下,拿下了超过九成的份额。需求的增加无疑让英特尔受益匪浅。


其次,新兴应用的出现给数据中心提出了新的需求,但传统CPU在处理这些新需求时显得有点捉襟见肘,这让当前数据中心处理器格局产生了新的变数。以人工智能的崛起为例,因为需要大规模的模型训练和迭代,并且单个模型的规模也越来越大(如具有1750亿参数的GPT-3模型需要上千块的GPU同时训练),这就带动了英伟达Nvidia GPU和谷歌Google TPU等具有先天优势的芯片在这个市场迅速普及。


与此同时,另一种新型处理器——DPU(Data Processing Unit)最近几年也开始在数据中心扮演日趋重要的角色。半导体行业观察在之前发布的两篇文章《为什么DPU那么火?》和《DPU技术发展概况》中解释了DPU的概念和应用。从业界共识看来,数据中心从以CPU为中心向以DPU为中心演进几成定局。


DPU——软件定义的芯片


从行业的发展史看来,DPU的出现是网络基础设施体系架构发展的又一个里程碑。DPU将成为数据中心基础设施的管理和运维中枢,负责将不同的数据调度给最合适的CPU、GPU以及支持各种未来应用的xPU进行处理,并卸载和加速网络、存储和安全等处理。在笔者看来,未来的数据中心将由DPU、CPU和GPU三大主要算力组成,每台服务器都需要一个甚至多个DPU产品。换而言之,DPU的数量和服务器的数量将至少处于同一个级别。


之所以DPU能承担起如此重要的任务,这与其过去多年在数据中心的应用演变有莫大的关系。


正如之前的两篇文章描述,我们现在说的DPU是SmartNIC(智能网卡)的下一代,作为一款不同于传统NIC(Network interface controller)的产品,智能网卡是为数据中心的网络和安全等进行加速和卸载等应用而生的,这在过去都是在CPU上完成。然而,随着需求的增加,CPU逐渐不堪重负,于是SmartNIC便逐渐将这些处理卸载下来。


随着行业对网络基础设施需求的提升,DPU应运而生。这种“新”产品不但增强了SmartNIC在网络协议和网络安全方面的能力,开发者还希望其能更好地应对数字智能时代数据爆发推动的“云-边-端一体化”趋势所带来的对计算时延、资源虚拟化和安全等需求。


可以肯定的说,DPU是从以CPU为中心向以数据为中心迁移的关键性基础技术。在真正解决和加速数据中心弹性网络、弹性存储、大规模低时延网络和安全的同时,它们还提供了虚拟机、裸金属和容器的统一化运维和管理。


在推动数据中心基础设施不断演进的同时,DPU的出现还能真正地为基础设施带来“降本增效”的效果,即将“CPU处理效率低下、GPU处理不了”的负载卸载到DPU,同时简化了数据中心的运维和管理,提升整个计算系统的效率、极大的降低整体系统的总体拥有成本(TCO)。正因为对DPU寄予厚望,英伟达用69亿美元收购了Mellanox,并认为DPU到2024年将会创造一个超过100亿美元的市场。这也正是国内外如此多相关行业从业者积极躬身其中的原因。


在国内崛起的这波DPU企业中,云豹智能是其中当之无愧的头部企业。自成立以来,他们都非常低调,不愿意接受采访。近期,半导体行业观察终于有机会接触到此家头部DPU企业,并与该公司创始人兼CEO萧启阳博士进行了一番交流,以了解这家拥有“软件定义芯片”这个高壁垒技术企业的成功密码。


所谓软件定义,根据字面意思,软件定义就是用软件去定义硬件的功能,其本质是硬件设计能够同时满足能效和灵活性需求。在数据中心领域,美国VMware早在十年前就提出了软件定义数据中心的思路。具体而言就是大规模实现数据中心虚拟化,让不同的用户共享数据中心的计算、网络和存储资源,同时让每一个用户拥有独立的服务质量,可以不受其他用户影响,使得数据中心运营成本大大降低。在后续的发展中,软件定义存储和软件定义网络等概念也被相继提出,进一步优化数据中心。


随着数据中心的发展,软件定义的DPU也将发挥更重要的作用。这主要是因为云计算的需求不断变化,云原生(Cloud Native)生态令可编程性更重要,云服务商要不断升级其场景和服务,不同客户/同一客户的需求也不断变化。为此,DPU除了要拥有高性能,从其架构上看,还应该是一款能满足不同应用和场景的软件定义芯片。

 

要打造符合上述要求的产品,这首先就要求DPU厂商非常深入地了解客户需求,并对不同应用场景都深刻理解,根据客户上层软件的不同需求和不同应用场景去抽象和定义产品;第二,其提供的DPU芯片还应该具备灵活和易用的可编程能力,兼容当前数据中心的主流开源软件,通用性强,对各场景都非常易用的同时,能支撑数据中心未来不同需求和应用的演进。


而云豹智能正是一家拥有如此实力的企业。要理解这句话,就必须从萧启阳博士的背景说起。

 

二十年磨一剑,打造世界最具颠覆性软件定义芯片



在创立云豹智能之前,萧启阳博士在芯片产业有着光辉的成绩,这在国内初创芯片公司的创始人中是极为少见的。如其在2002年在美国硅谷创立并成功运营的RMI公司就是其中最为耀眼的一段。

 

据了解,RMI是一家研发高性能多核处理器的著名芯片公司,其推出的芯片被国内外最大的几家通讯网络设备商大规模广泛应用在无线基站、基站控制器、核心网、路由器、存储、安全设备、以及智能网卡(SmartNIC)上。由于看准了通讯市场需要高性能兼可编程芯片的重要性,RMI开发了一款当时业界最高性能的多核处理器。值得一提的是,这款多核处理器本身就是一款软件定义芯片,也正因为RMI芯片早期在智能网卡上的应用,让萧博士和他当时的团队成为业内最早对智能网卡和DPU有深刻理解的技术团队。


2009年,在NetLogic(美国纳斯达克上市公司)和RMI合并之后,萧博士转任NetLogic亚太区总裁兼总经理。同样的,他在接下来几年也带领其团队屡传佳绩:2011年,他带领团队打败了时任Freescale VP 的Lisa Su(现任AMD CEO)的团队,赢下了国内最大的4G基站CPU项目;2012年,萧博士又促成博通Broadcom以37亿美元现金高价并购NetLogic;在并购完成后,他在博通担任处理器和无线基础设施事业部大中华区总经理。

 

由于萧博士领导的原RMI团队对智能网卡和DPU的深刻理解,在他离开博通之后,国内最大的云服务商之一将原RMI的部分核心团队挖走,然后在这家云服务商从0到1打造了目前为止国内最大量商用的DPU智能网卡。


萧博士能在过去二十年的芯片生涯里屡创佳绩,不单是因为他领导的团队都是业界精英,还因为他对芯片和软件技术有着深刻理解,对商业落地和客户需求有着深度洞察,以及对商业时机能够准确把握。


半导体行业观察记者同时还观察到,全世界最大的几家芯片公司的CEO都有个共性,就是都拥有高学历和高IQ,均毕业于世界最顶尖学府。

 

比如英伟达的创始人兼CEO Jensen Huang 是斯坦福Stanford大学硕士,英特尔的现任CEO Pat Gelsinger也是斯坦福大学硕士,AMD CEO Lisa Su是麻省理工MIT博士,博通的CEO陈福阳Hock Tan是MIT 本科毕业,哈佛Harvard的MBA;而萧博士24岁已获得斯坦福大学博士学位,其后曾任MIT教授。他在斯坦福大学的博士论文,破解了当时在人工智能领域上三十多年来未能解决的理论问题,此突破性研究,令他荣获美国国家科学基金会青年研究员奖。读研究生前,他仅用了三年半的时间就以最高荣誉(Summa Cum Laude)同时在纽约大学和纽约库珀学院获得了数学、计算机科学和电子工程三个本科学位。在MIT担任讲座副教授期间,萧博士则长期专注于网络和分布式计算研究领域,并获得了IEEE和SPIE颁发的最佳研究论文奖。也就是在这个阶段,多家世界知名的电讯网络企业,包括思科Cisco、朗讯Lucent、AT&T、Sprint和NTT DoCoMo等都邀请萧博士担任技术专家顾问。

 

虽然拥有如此经验丰富的产学研背景和在硅谷成功的大芯片创业经历,但对萧博士而言,他真正想做的是利用自己过去二十年的这些成功经验,为行业带来颠覆性的国产芯片,为中国半导体产业打造一个世界级的企业,DPU就成为了他的新起点。萧博士认为,DPU必将引领数据中心基础架构的变革和演进,并将数据中心提高到一个新的台阶,为应用的扩展能力、响应速度、服务质量和安全提供最好的解决方案。

 

在定下了目标后,萧博士和曾经合作过二十年的核心团队,集合业内精英一起创办了云豹智能。据介绍,公司的创始团队平均拥有超过20年的芯片研发及大规模商用经验,对软件定义芯片有深刻理解,同时还是业内最早研发和应用智能网卡和DPU产品的精英团队。

 

据笔者获悉,云豹智能整个团队对国内最大的几家云服务商需求和数百种不同的应用场景都非常熟悉,其创始成员曾领导及成功开发多代FPGA-based DPU和DPU SoC芯片,并成功规模商用。不夸张地说一句,云豹团队甚至比英伟达对中国客户在DPU领域的需求理解更深入。


毫无疑问,DPU的软件定义特性将会是云豹智能的一个非常大的优势,这也是萧博士过去二十年来一直专注的。


得益于其团队的超强芯片和行业背景,云豹智能在短时间内就交出了一份亮丽的成绩单。据笔者了解,云豹智能已开发完成一款新型基于FPGA的高性能DPU网卡解决方案,全面支持虚拟机、裸金属和容器云业务一体化,并具备高性能及全功能弹性存储和弹性网络,提供集虚拟化管理、弹性储存、弹性网络、安全加速为一体的一站式解决方案,将极大地提升云服务商的服务质量和业务灵活性,并降低其整体投入和运维成本。

 

从现在的DPU业态看来,其最终产品呈现两种形态,一种是FPGA-based DPU解决方案,另一种是SoC-based DPU解决方案。有不少读者认为,现在的初创企业打造基于FPGA-based DPU,似乎并没有很大的技术含量,但据笔者所知,事实的真相并非如此:

 

一方面,当前还没有最合适的可编程DPU SoC芯片的时候,FPGA-based DPU解决方案是短期内唯一的最优方案;另一方面,虽然业内很多PCIe加速卡声称是DPU网卡或智能网卡,但据了解,国内除了几家大型云服务商花费数年自研的FPGA-based DPU解决方案外,还没有看到独立的第三方公司真正实现FPGA-based的完整DPU解决方案,由此足见即使是FPGA-based DPU解决方案,其仍然需要对业务的深入理解和非常高的技术门槛。

 

云豹智能则凭借团队多年的经验积累和对云业务的深刻理解,成功打造了一款行业内全面支持虚拟机、裸金属和容器云业务一体化的FPGA-based DPU完整解决方案,主攻未来几年25G到100G的市场。该产品在降低云服务商的整体TCO,并提供虚拟机、裸金属、容器的统一运维和管理方面表现得更有优势,帮助云服务商解决了真正的痛点。


不过,我们必须承认一点,虽然FPGA的灵活性很强,但其功耗和成本太高也是不争的事实,很多云服务商也认为FPGA不能支持200G及以上的网络速度和低成本的需求。基于这种考虑,云豹智能正在同步开发一款极具颠覆性的DPU软件定义芯片,该SoC将会成为业界最高性价比之一的芯片,主要聚焦200G及以上的市场。


据笔者所知,云豹智能正在研发的DPU芯片是一款非常复杂和技术门槛极高的软件定义芯片,从定义规格到完成大概需要两年时间,这与国外顶级芯片大厂做同类型芯片所需要的时间是一致的。

 

中国半导体行业诞生一颗超新星


在与萧博士沟通的过程中他多次强调,对于做芯片的企业来说,其目标必须是商业落地的成功,而不仅仅是将技术做到最牛。要达成这个目标,就需要对产业有深度认识以及与客户有深度合作才能做到,这正是云豹智能团队所具备的,也是他们能与国内最大的几家云服务商建立深度合作的重要原因。

 

在问到对DPU未来发展的看法时,萧博士表示,为应对未来多元化的应用及客户不断变化的需求,DPU也将不断的发展和创新。在云豹智能方面,公司的DPU将基于异构的可编程架构平台及该平台的不断创新,以满足未来可以遇见的不同应用场景,且非常灵活且易用性强。

 

“云豹DPU将不单应用在大型数据中心,也将会应用在边缘计算、5G、智能电动汽车等场景上。”萧博士补充说。

 

而在谈到公司对未来的规划时,萧博士表示,他的目标是带领云豹智能成为一家世界级的企业。这从其公司名就可以窥见。所谓“云豹”就是云中捷豹,作为跑得最快的动物,豹代表了灵活和速度,且静待时机和不动声色。更重要的是,豹一旦出手,就必然一举击中目标。

 

“从世界芯片现状来看,在DPU的软件定义芯片方面,很难找到比云豹智能更好的团队去开发这款芯片,并做到商业落地和成功。”萧博士强调。


正是因为拥有如此的实力和底气,云豹智能在资本市场上受到投资者的热捧。但萧博士却表示,这其实并不是公司的重要关注点。他指出,懂芯片行业的成功投资者都知道芯片领域是‘赢家通吃’,因此在他们投资的时候就会非常看重创始团队是否成功创业过?是否有做过类似大芯片及其软件的经验?以及其产品是否曾经成功大规模商用过?


虽然萧博士没直接回答这个问题,网上也没有看到云豹智能的任何融资消息披露。但据业界人士所说,云豹的融资及估值是中国DPU行业当前最高的,也是国内DPU领域当之无愧的头部企业。

 

作为一名顶尖学者和一位成功的企业家,萧博士不仅对大芯片、云计算和人工智能等领域有深刻理解,同时集理论、实践、管理、销售和企业并购等能力于一身。在一个拥有如此背景的人的领导下,云豹智能必将成为中国半导体行业的一颗超新星。

 

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。