清华团队创建,这家企业做可重构计算芯片,3年量产3颗
导读:“以软件定义硬件”为主要特征的可重构计算架构正成为芯片的新风潮之一。
文/林京
“以软件定义硬件”为主要特征的可重构计算架构正成为芯片的新风潮之一。
美国提出的旨在支撑美国2025-2030年电子技术能力的“电子复兴计划”,其核心关键技术就是可重构计算;基于该技术的核心团队斯坦福大学的SambaNova,目前是全球估值最高的AI芯片独角兽企业;英特尔、英伟达、赛灵思等企业也纷纷开始布局可重构架构相关芯片业务。
随着芯片行业的发展,昔日被奉为圭臬的摩尔定律正面临失效讨论。在万物互联时代,数据激增,对算力提出更高要求。可重构计算芯片等新型架构出现,也可谓是恰逢其时,相比传统计算架构,它有百倍性能提升。
在国内,清微智能是可重构计算芯片的领军企业,这家依托于清华微电子所在可重构计算领域内近二十年技术积累的企业,在成立的三年时间内,已有三颗芯片量产,上千万颗芯片落地应用,成为全球商业应用规模最大的可重构计算芯片企业。从清微智能的创业历程与发展脉络,我们也能一窥可重构计算芯片的发展潜力与未来趋势,一条解决芯片国产化问题的差异化道路。
依托清华微电子所技术积累,开启第二次创业
“如果当年大学选择物理专业,也许就没有今天的创业了。”在回忆创业时,清微智能创始人王博笑着调侃道。
大学报志愿时,因为对通信行业前景的看好,王博放弃自己擅长的物理专业,选择了北京邮电大学。
他是一名跨领域的连续创业者。毕业之后,王博在导师公司参与研究中国第一代数字交换机、路由器。2006年,他又进入云计算领域,成为汉柏科技CTO。汉伯科技在人脸识别技术等领域亦是行业先行者,并进行了广泛落地应用。
清微智能成立则源于在汉柏科技期间,王博带着团队想找一款高性能、低功耗的AI芯片,但调研了许多企业,都不尽如人意。
后来,在好友介绍下,王博认识了清华大学微电子所副所长、Thinker芯片团队带头人尹首一,两人深聊之后,都希望将可重构芯片进行产业化落地。彼时,清华微电子所是可重构计算架构学术领域的先行者,深耕已久——2006年清华可重构实验室成立;2015年起,清华微电子所将可重构架构应用在AI计算、神经网络计算场景,并设计了一系列AI芯片。
2018年,王博带领清华大学可重构计算团队创办了清微智能。“那时候虽然还没有贸易战,但我始终觉得芯片产业技术密集、产值巨大,属于高端产业,中国人必须要把核心的东西掌握在自己手里。而可重构计算计算一是底层技术,二是核心知识产权在我们自己手里,三是通用灵活,适合智能化程度越来越高的时代需求,我们有希望走出一条不同于国外的路线。”王博说
截至目前,面向AIOT的产品系列,其高性能,强大的灵活性已经得到了市场验证,在一些细分领域,甚至能占据60%以上的市场份额。清微智能也已经顺利完成三轮融资,背后包括国开装备、百度战投、君海创芯等一众知名投资机构。
今年三月,清微智能完成数亿元B轮融资,由国开装备基金领投,商汤国香资本、明智资本、北京集成电路尖端芯片基金及原股东君海创芯、卓源资本跟投。
目前,清微智能共有边缘端的TX2系列、TX5系列芯片和用于服务器领域的TX8系列三类芯片。
其中,TX2和TX5系列芯片产品已应用至智能安防、金融支付、智能穿戴,智能机器人等多个领域,涵盖多家品牌客户和数百方案商。
TX8系列芯片则是面向云端数据中心、智算中心等场景,用可重构数据流提供无限扩展能力和高密度高能效计算能力,目前,已与多家重点企业签署了战略合作协议。
用可重构计算架构,突破芯片瓶颈
原清华大学微电子所所长、IEEE Fellow魏少军,也是第一代可重构计算架构的缔造者,他曾解释称,可重构芯片不属于CPU、GPU、FPGA 或 ASIC,它是一种全新类别的芯片,其特点是软件硬件都可以编程、混合粒度、芯片的硬件功能随软件的变化而变化,应用改变软件、软件再改变硬件。
此外,传统的计算架构采用的是指令驱动的时域计算模式,在指令执行过程中需要频繁的搬运数据、访问存储器,这些高频的操作会导致芯片的功耗过高。
据悉,在传统的计算芯片里面,将近占80%的系统资源都是用来做数据存储或者做计算前的准备,仅有20%用于计算。对比之下,可重构计算计算芯片则可以将系统资源用于计算,极大提升效率。
但须知可重构计算并非新鲜事物。公开资料显示,20世纪60年代末,加利福尼亚大学的Geraid Estrin首次提出重构计算,彼时受限于技术未能实现。据维基百科,上世纪八十年代面世的FPGA可算得上是“可重构”概念的产物。
可重构计算被《国际半导体技术路线图》评为最具前景的未来计算架构,美国电子复兴计划(ERI)将可重构计算技术列为未来美国在电子行业一直保持领导地位的核心关键技术,是后摩尔时代的颠覆性技术之一。
王博介绍,相比传统架构,可重构计算在算力越大的场景里,优势越明显。同时它具备即时重构、高能效、低功耗、通用性、灵活性等诸多特点。以用户端感受而言,在使用手机时,电话降噪效果更好、待机时间更长。
他举例介绍道,可重构计算芯片在可穿戴设备里面代替了传统DSP,在音频降噪算法上,相比传统DSP,能降低5~10倍能耗。
“同样的功耗限制之下,我们可以提供更大的算力,比如传统架构上,每瓦大约三至五个个T的算力,我们是每瓦十个T的算力水平。”王博说。
以传统安防厂商为例,通过可重构计算芯片,可以提供灵活可编程的ISP能力,跑更复杂的算法,在人脸识别、车辆识别上等场景达到更高的精准度。
而到了云端大算力场景,会面临更大算力和更加灵活多样的任务需求,计算系统会越来越复杂,功耗成了更大的挑战,兼顾灵活性以及更高能效比的可重构芯片优势会更加明显。
依托于清华微电子所深厚的技术积累,王博的第二次创业可谓是开展迅速,但初期在产品上,他还是踩了一个很大的“坑”。
2019年6月,清微智能推出的第一颗可重构计算架构芯片——超功耗智能芯片TX210,这款芯片具备超高能效特性支持always-on语音识别,待机时间超过40小时,并在三年内取得数百万颗的销量。
但后续市场发生了一个剧烈变化,许多知名企业很聪明的在主芯片上做了TX210的功能集,用户不再愿意为一个单独的芯片付费。
“这是公司最大的的一次试错。”也让王博深刻认识到:寻找一个长期稳定的方向,做“硬通货”产品。
整体来看,清微智能沿着小算力、中算力、大算力的产品路径进行研发,今年正在研发的面向云端服务的TX8系列芯片,可重构计算具有天然可扩展性,通过资源扩展增加算力,适配云端AI复杂算法应用需求时,其一次性配置的代价边际,会随着在当前配置下的硬件被多次执行而降低。同时,面对云端应用算法的数据流特性,基于CGRA的调度,以空域并行的方式执行,可以大大提高CGRA资源的利用率,提高云端应用的吞吐量,解决数据中心规模不断扩大带来的能效问题。目前,清微智能芯片销售超千万颗,客户含阿里、腾讯、海康,华为、国网,商汤,小米等,去年营收数千万,今年营收预计在两个亿左右。
资本涌入、抢芯片人才……机遇挑战并存
作为国内可重构计算芯片的先行者,王博说,清微智能TX8系列芯片的目标是做中国的英伟达。
虽然是榜样,但英伟达等巨头企业入局,王博也并不慌张,除了清华微电子所十余年的技术积累,他认为创业公司的唯一优势是“天生没有包袱”。“巨头公司,需要延续历史的兼容性,只能从很小的一些点去切入,进行技术升级。但我们现在做的TX8系列芯片,改变原有的以存储为中心,通过交换机扩展的架构方式,采用完全的数据可重构,不需要大量的存储器开销,在寄存器直接传导数据,这种高度灵活的数据流重构能力,大大提高了计算效率。”
“不可否认,芯片行业正面临时代机遇,但也难免会产生泡沫。”王博说,政策红利、资本涌入,会助力企业加速发展,但同样也会推高成本,还要看企业如何抉择。
疫情之下,王博说,企业也面临诸多挑战,比如下游工厂因封控造成的供应链紧张,但更大的挑战来自于人才。
“资本涌入,芯片人才供不应求,让行业的平均投入推高了至少一倍。企业之间挖墙脚、抢芯片人才的现象几乎每天都在上演……”王博介绍,除了提升员工薪资水平之外,也会通过期权承诺、员工福利关怀等多种途径稳定“军心”。
人才成本剧增引起的多米诺骨牌效应之一便是,企业追求低端化市场,将面临一定危机。
“随着芯片售价下降,生产成本又居高不下,芯片行业的另一挑战在于毛利下降,盈利空间变小。”王博认为,从另一个角度而言,倒逼产业链升级,推动整个行业朝着高端化方向发展。
资本涌入的另一影响在于,企业的发展速度要更快。“资本重押之下,压力肯定是有的,你会发现每个细分赛道上都有很多创业公司在做同样的事情,这时候你要跑的更快,更加贴近你的客户需求。”
B轮融资之后,王博介绍,清微智能将进一步夯实已有市场,快速推出新一代通用TX8大算力芯片。有消息称:清微TX8队伍目前已汇集了在Intel、苹果等公司工作多年的主架构师,还有不少来自英伟达、阿里的工程技术骨干,产品力争明年下半年进行小范围交付。