从最强AI算力到“元脑”2.0,智算加速产业变革
导读:在近日的IPF 2021(浪潮合作伙伴大会)上,浪潮信息总裁彭震指出,视频数据处理将会成为未来AI计算赋能的重点,同时,业界已发布超过100多种芯片,多元化的算力会促进产业智能化转型。基于上述趋势,浪潮推出了相应的AI服务器产品,并不断完善产业智能化转型的“元脑”生态。
作者 | Just
出品 | AI科技大本营(ID:rgznai100)
AI模型的数据量、结构的复杂程度不断增加,带来了大规模AI算力的庞大需求。
2020年7月,OpenAI实验室推出拥有1750亿参数的NLP模型GPT-3,其训练数据集规模超过500GB,算力需求达到了3640 Petaflop/s-day。2021年1月,Google Brain宣布他们设计的简化稀疏架构(Switch Transformer)可以将语言模型的参数量扩展到1.6 万亿,参数量是GPT-3的近10倍。要让这些模型有效有效运转需要AI芯片和AI服务器。
据浪潮估计,2020年,以GPU为代表的AI加速芯片所交付的算力已经超过同类CPU,预计到2025年,AI加速芯片所提供的算力可能在超过80%。而据最新的IDC数据统计,浪潮人工智能服务器的市场占有率在全球为16.4%,已经排到全球第一位,而在中国,浪潮AI服务器已经连续四年排名第一,市场份额超50%。
在AI计算方面,一些新变化正在发生。在近日的IPF 2021(浪潮合作伙伴大会)上,浪潮信息总裁彭震指出,视频数据处理将会成为未来AI计算赋能的重点,同时,业界已发布超过100多种芯片,多元化的算力会促进产业智能化转型。基于上述趋势,浪潮推出了相应的AI服务器产品,并不断完善产业智能化转型的“元脑”生态。
推出最强AI服务器,全方位打造AI计算产品阵列
首先,浪潮联合寒武纪推出了AI服务器“扬子江”,这是业界首款一体搭载8颗寒武纪最新思元290人工智能芯片的AI服务器。
基于浪潮的AI服务器架构,融合寒武纪多芯高速互联技术,提供高达4096Tops的峰值计算性能,为AI训练、推理或混合型人工智能计算加速任务提供超强AI算力支撑。
据介绍,扬子江AI服务器适用于构建大规模并行计算集群,支持跨节点互联带宽高达448 GB/s,满足超大型AI模型训练需求。
同时,搭载寒武纪AI芯片的扬子江系统兼容×86开发生态、支持TensorFlow、PyTorch等业界主流深度学习框架,适配浪潮AIStation高效资源平台,可帮助客户提升模型开发效率3倍、提升业务迁移效率20倍。
寒武纪联合创始人、副总裁刘道福称,在AI服务器领域,浪潮和寒武纪联合,推出了基于寒武纪思元100、思元270、思元290等AI芯片的服务器产品,在互联网、云计算、智算中心等诸多行业和领域实现了规模化的落地部署应用。
浪潮全新还发布了NF5488 AI服务器,支持部署8颗NVLink高速互联的A100GPU,并率先实现500W液冷、风冷同代兼容,以及CPU到GPU单层的Switch通信拓扑。
相比上一代的计算产品,NF5488的性能最高提升20倍。其4U空间搭载2颗Icelake CPU和8颗A100 GPU,极致空间优化,较业界提升40%。其次,浪潮自研NVLINK A100 GPU基板,在业界率先实现CPU-GPU间单层PCIe switch通信,通信效率提升1倍。在海量数据的预处理、清洗、训练中,NF5488可为用户带来更高的收益,同时结合其庞大的算力,可缩短一半的开发周期。
2020年,浪潮NF5488 AI服务器在全球权威AI基准测试MLPerf中共创造19项性能纪录,成为创纪录最多的AI服务器,在众多AI计算场景中均表现出最强性能。
浪潮还发布高效能AI视频加速器(Video Processing Unit)M10A,是业界首款在8W超低功耗实现16路1080P视频处理加速产品,网络带宽利用率翻倍,计算CPU负荷降至2%,为直播、短视频、视频会议、云游戏等行业客户带来超高效能的加速体验。
浪潮AI&HPC产品线总经理刘军表示,这款产品的推出主要是为了有效应对当前视频业务数据爆发和AI计算带来的巨大挑战,解决海量视频AI处理过程的业务瓶颈,推动视频产业加速发展。
总之,向着高算力、高可扩展性、高性价比的目标,浪潮已推出的AI计算产品阵列可以全方位地满足不同训练和推理场景的算力需求。
元脑生态2.0升级,解决智能化转型多重挑战
为了帮助行业更好地进行智慧化转型,加速AI技术方案提供方和需求方之间的匹配效率,浪潮于2019年提出了元脑生态计划。目前,生态已经发展了15000千多个合作方,包括2200多个行业ISV。在人工智能百强企业中,85%都与浪潮有深度合作。
今年,元脑生态升级到2.0版本。其中,新增的“AI Store”功能类似于手机可以下载应用的App Store,通过AI Store,传统企业可以选择与业务需求匹配的AI解决方案,提高与AI企业的需求对接效率。
值得一提的是,为了应对愈加复杂的应用场景和异构产品组合,浪潮还发布了业界首款智算操作系统元脑OS,方便统一管理和调度资源管控中心平台和智算中心。
通过元脑产品体系,浪潮进一步加速落地智算中心,以智算能力驱动应用创新和产业升级。
比如,荣联科技、趋动科技、浪潮携手助力西湖大学智算中心建设,是一个“AI算力配置+AI集群优化+实施运维能力”的顶级智算中心方案交付配置。
在POC方案设计阶段,针对西湖大学的AI集群方案,进行了高标准的设计规划,浪潮提供了当时最全套的硬件平台设备。同时,通过将浪潮的AIstation AI集群调度系统与趋动科技的OrionX AI算力池化加速方案进行无缝的融合,对AI算力和应用负载进行精细化管理,提升50%AI算法开发部署效率,提升5倍以上的AI资源利用率,总体TCO降低约80%。
通过元脑生态,他们希望建立强有力的生态合作伙伴体系,以此来满足产业的智慧化转型服务需求。
浪潮认为,计算正在向智算转型,多元算力融合成为关键,智算中心基建化是未来计算产业的新格局。