瀚博半导体发布首款AI推理芯片:性能超英伟达T4,客户包括快手
导读:2021世界人工智能大会上,国产芯片公司瀚博半导体正式向外发布首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,目前已成功流片,预计在今年四季度量产上市。
记者 | 姜菁玲
2021世界人工智能大会上,国产芯片公司瀚博半导体正式向外发布首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,目前已成功流片,预计在今年四季度量产上市。
该公司定位为高性能人工智能与视频处理芯片解决方案提供商,视频加AI联合设计是其核心竞争力。瀚博半导体创始人兼CTO张磊介绍称,SV100系列芯片为DSA架构,相同功耗下可以实现数倍于数据中心GPU(如英伟达 T4、A10)的最高深度学习推理性能。
“计算机视觉占据AI应用的大半江山,视频流占整个数据流的70%,包括长短视频、直播视频、安防视频等等,而且这个百分比会越来越高,整个的数据基础也会越来越大,所以视频有关的数据绝对是一个海量的数字。”瀚博半导体创始人兼CEO钱军在接受包括界面新闻在内的媒体访问时表示。
钱军认为,占据过半中国AI应用市场的计算机视觉应用,需要高密度的视频解码算力配合AI算力实现端到端的计算加速。AI要为视频做好优化,在性能上需要极低延时,极高吞吐性能,还要保持低能耗。
基于 SV102 芯片,瀚博推出的适用于云服务器的 VA1 机器学习加速卡,其提供高效率深度学习 AI 推理加速,在同等能耗下可以实现 2-10 倍于 GPU 的最高 AI 吞吐率,适合实时应用,同时兼备良好的通用性和可扩展性,支持 FP16, BF16 和 INT8 数据类型的众多主流神经网络快速部署——包括检测,分类,识别,分割,视频处理,LSTM/RNN,NLP/BERT,搜索推荐等。
作为投资人的短视频头部公司快手也是瀚博的客户之一。钱军在采访时表示,瀚博与重要合作伙伴快手的合作非常紧密。目前已有多家国内外科技公司正在和瀚博合作,并等待芯片的大规模量产。
对于全球缺芯问题,钱军表示,目前瀚博今年产能已出,明年大部分的产能已提前预知,不过如果剩下产品卖的特别好,也有可能面临产能问题。
瀚博半导体2018年12月成立于上海,在北京、深圳和多伦多均有研发分部。公司创始人曾为AMD高管,CEO钱军曾在AMD任Senior Director,全面负责GPU(图像处理器)和AI服务器芯片设计和生产,CTO张磊2013年晋升为AMD Fellow,负责AI、深度学习,视频编解码和视频处理领域,其公司团队部分成员曾设计了业界首款 7nm 制程 GPU。
融资方面,结合钱军所透露的情况与公开资料,瀚博在2019年3月收到真格基金独家天使轮投资,同年7月,收到A轮融资。2020年11月,瀚博宣布获得由快手、红点创投中国基金、五源资本联合领投的5000万美元A轮融资,今年4月该公司又获得由中国互联网投资基金和经纬中国联合领投的5亿元人民币A+轮融资。