数据中心行业专题报告:数字经济+AI浪潮下IDC或迎投资机遇
导读:中国算力发展持续快速增长。根据城市大脑研究院,IDC 预测,中国智能算力规模将持续 高速增长,预计到 2026 年中国智能算力规模将达到 1271 4EFLOPS,22-26 年复合增长率 达 52 3%,同期通用算力规模的复合增长率为 18 5%。
(报告出品方/作者:天风证券,唐海清,王奕红)
1.什么是ChatGPT?
ChatGPT 近期获得较高的关注度,人们可以与其聊天对话,进行文本互动,那么什么是 ChatGPT 呢? ChatGPT 是美国人工智能研究实验室 OpenAI 开发的一种全新聊天机器人模型,它能够通 过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成 一系列任务。
其中 GPT 指代的是一种模型,其是“Generative Pre-trained Transformer”生成型预训练 变换模型的缩写,目的是为了使用深度学习生成人类可以理解的自然语言。目前我们讨论 的 GPT 一般指的是 GPT-3,显而易见,在之前还有 GPT-2 和 GPT。 GPT-3是由人工智能公司OpenAl训练与开发,该模型设计基于谷歌开发的变换语言模型。 GPT-3 的神经网络包含 1750 亿个参数,为有史以来参数最多的神经网络模型。OpenAI 于 2020 年 5 月发表 GPT-3 的论文,微软在 2020 年 9 月 22 日宣布取得了 GPT-3 的独家授权。
回顾 GPT 的发展,GPT 家族与 BERT 模型都是知名的 NLP 模型,都基于 Transformer 技术。 GPT,是一种生成式的预训练模型,由 OpenAI 团队最早发布于 2018 年,GPT-1 只有 12 个 Transformer 层,而到了 GPT-3,则增加到 96 层。其中,GPT-1 使用无监督预训练与有 监督微调相结合的方式,GPT-2 与 GPT-3 则都是纯无监督预训练的方式,GPT-3 相比 GPT-2 的进化主要是数据量、参数量的数量级提升。
而 InstructGPT/GPT3.5(ChatGPT 的前身)与 GPT-3 的主要区别在于,新加入了 RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习),其增强了人类对 模型输出结果的调节,并且对结果进行了更具理解性的排序。应用 Tamer 框架,ChatGPT 可 以比 GPT-3 更好的理解和完成人类语言或指令,模仿人类,提供连贯的有逻辑的文本信 息的能力。ChatGPT 算法成功的原因:强大的基座模型能力(InstructGPT)、大参数语言模型(GPT3.5)、 高质量的真实数据(精标的多轮对话数据和比较排序数据),以及性能稳定的强化学习算 法(PPO 算法)。
2.ChatGPT的运行机制
OpenAI 利用 RLHF 来训练模型(该方法在训练中使用人类反馈,以最小化无益、失真或偏 见的输出),使用与InstructGPT相同的方法,但数据收集设置略有不同。通过使用supervised fine-tuning 来训练初始模型,将这个新的对话数据集与 InstructGPT 数据集混合,并将其 转换为对话格式。
方法总体上包括三个不同步骤: 1、有监督的调优:预训练的语言模型在少量已标注的数据上进行调优,以学习从给定的 prompt 列表生成输出的有监督的策略(即 SFT 模型); 2、模拟人类偏好:标注者们对相对大量的 SFT 模型输出进行投票,这就创建了一个由比 较数据组成的新数据集。在此数据集上训练新模型,被称为训练回报模型(Reward Model, RM); 3、近端策略优化(PPO):RM 模型用于进一步调优和改进 SFT 模型,PPO 输出结果是 的策略模式。 第一步是收集数据,以训练有监督的策略模型。为了创建像 ChatGPT 这样的通用聊天机 器人,开发人员是在「代码模型」而不是纯文本模型之上进行调优。第二步是训练回报模 型,这一步的目标是直接从数据中学习目标函数。第三步是使用 PPO模型微调 SFT 模型, 这一步里强化学习被应用于通过优化 RM 模型来调优 SFT 模型。
3.ChatGPT会提升多少算力?
中国算力发展持续快速增长。根据城市大脑研究院,IDC 预测,中国智能算力规模将持续 高速增长,预计到 2026 年中国智能算力规模将达到 1271.4EFLOPS,22-26 年复合增长率 达 52.3%,同期通用算力规模的复合增长率为 18.5%。
ChatGPT 将需要大量算力和计算资源。根据通信世界数据,ChatGPT 的总算力消耗约为 3640PF-days (即假如每秒计算一千万亿次,需要计算 3640 天) ,需要 7-8 个投资规模 30 亿、算力 500P 的数据中心才能支撑运行。ChatGPT 需要 TB 级的运算训练库,甚至是 P-Flops 级的算力。ChatGPT 包括研发(训练)和应用(推理),其都需要大量智能计算资源和数 据存储及传输资源。
现阶段的 ChatGPT 是在拥有 3000 亿个单词的语料基础上预训练拥有 1750 亿参数的模 型,GPT-4 将是一个拥有超过 100 万亿级别参数的大模型。根据学术界的既有研究可知, 深度神经网络的学习能力和模型的参数规模呈正相关。人类大脑皮层有 140 多亿个神经细胞,每个神经细胞有 3 万余个突触,因此,大脑皮层的突触总数超过 100 万亿个,神 经细胞通过突触相互建立联系。一旦 GPT-4 实现 100 万亿参数规模,就可以堪比人的大 脑,意味着它将达到与人类大脑神经触点规模的同等水平。
下游应用场景有望持续拓展。目前 ChatGPT 的主要应用场景包括但不限于无代码编程、小 说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟人、人工智能客服、机器 翻译、芯片设计等。随着算法技术和算力技术的不断进步,ChatGPT 也有望进一步走向更 先进功能更强的版本,在越来越多的领域进行应用,为人类生成更多更美好的对话和内容。
4.对数据中心的影响
未来异构计算或成为主流。在 CPU+GPU 的异构计算架构中,GPU 与 CPU 通过 PCle 总线连接协同工作,CPU 所在位 置称为为主机端 (host),而 GPU 所在位置称为设备端(device)。基于 CPU+GPU 的异构计 算平台可以优势互补,CPU 负责处理逻辑复杂的串行程序,而 GPU 重点处理数据密集型 的并行计算程序,从而发挥最大功效。A100 服务器系统功耗明显提升。以 NVIDIA 的 DGX A100 640GB 为例,其配置了 8 片 A100 GPU,系统功耗达到最大 6.5 千瓦,未来随着 A100 服务器的应用增多,我们认为或将显著 提升数据中心机柜的功耗。
机柜功率或将迎来大幅提升。通常 19 英寸机柜和 42U 机柜是标准机柜,参考高度 1U=4.445 厘米,宽度 19 英寸约为 48.26 厘米,英伟达 DGX A100 640GB 宽度上基本约为 19 英寸, 高度上大约为 5.94U,以标准机柜 42U 为参考,最大限度可以放下约 7 台 DGX A100 640GB 服务器(实际需要预留散热、挪动、走线等的空间),最大功率可达到约 45.5KW。ChatGPT 训练将带来较大的碳排放。ChatGPT 是基于 GPT-3 的一个升级版本,在 GPT-3 的模型架构基础上进行了优化并在训练时期增加了强化学习。训练一个 GPT-3 约消耗 1287 MWh(兆瓦时)的电,相当于排放了 552 吨碳,由于强化学习需要额外消耗的电力,ChatGPT 在模型训练阶段所产生的碳排放将大于 552 吨。
东数西算下 PUE 指标严格。随着东数西算的实施,其推出针对上架率、能效指标作出规范 要求,同时如北京、上海等核心区域出台能耗管控指标,有望助力行业有序发展,也突显 出一线地区机柜资源的稀缺性。21 年 11 月,《贯彻落实碳达峰碳中和目标要求推动数据中 心和 5G 等新型基础设施绿色高质量发展实施方案》提出,全国新建大型、超大型数据中 心平均用电效率降至 1.3 以下,全国中心节点进一步降至 1.25 以下,绿色低碳水平达到 4A 以上。数据中心基础设施根据冷却方式不同可分为风冷数据中心基础设施和液冷数据中心基础 设施。风冷方式起步较早,技术相对成熟;液冷方式是近几年因数据中心散热需求提升而 出现的一种新方式,技术尚处于发展阶段。液冷方式分为冷板液冷和浸没式液冷,浸没式 液冷方式又可分为相变浸没式液冷和非相变浸没式液冷。
制冷散热主要方式:目前发展的散热冷却技术主要有风冷和液冷两大类,其中风冷包括自 然风冷和强制风冷,适用的机柜功率密度较低;液冷分为单相液冷和相变液冷。散热冷却 系统所采用的冷却介质、冷却方式不同,移热速率差距大。传统风冷最高可冷却 30 kW/r 的机柜,对于 30 kW/r 以上功率密度的机柜无法做到产热与移热速率匹配,会使机柜温度 不断升高导致算力下降甚至损害设备。 可以看到,采用 A100 后服务器功率大幅提升,参考上文若采用英伟达 DGX A100 640GB 服务器,单机柜的功率或将超过 30kW,此时更适宜应用液冷的冷却方案。液冷分为间接液冷、直接单相液冷和直接两相液冷,主要根据液体与 IT 设备接触状态来区 分。
目前而言,普遍应用的是冷板冷却的方式,使用的是液冷和风冷相结合的方法,对芯片采 用液冷,对硬盘等其他电器元件采用风冷,并非严格意义上的单纯液冷。属于间接液冷的 一种方式,冷板能冷却小于 45 kW/r 的机柜更节能且噪音小,不需要昂贵的水冷机组,与 纯液冷对比也有一定优势。单相浸没式液冷制冷效果更强,但难度较高。单相浸没式液冷需要对液冷材料进行筛选(满 足绝缘性强、黏度低、闪点高或不燃,腐蚀性小,热稳定性高,生物毒性小等性能要求) 和 IT 设备进行设计,但该方式可以实现冷却的传热系数范围更广。
5.重点企业分析
5.1.润泽科技:
国内领先的数据中心整体解决方案提供商。润泽科技发展有限公司于 2009 年 9 月在廊坊 经济技术开发区注册成立。自成立以来,公司始终专注于开发及运营超大规模、高等级、 高效高性能数据中心集群。目前润泽科技在廊坊建设运营的润泽(廊坊)国际信息港数据 中心集群,规模位居全国前列,2009 年成立以来陆续启动廊坊 A 区工程建设,布局长三 角、大湾区、成渝经济圈、西北地区数据中心建设,建设超大规模数据中心产业园区;并 与中国电信、中国联通等电信运营商通过长期合作建立了良好的业务关系,为其提供数据 中心整体解决方案。
公司近年收入与利润增速较快,营收有望保持高速增长。营业收入来看,公司营收全部为 数据中心业务收入,2019-2021 年营收复合增长率达到 43.89%,整体营业收入不断增长。 2022 年 Q3 实现营收 7.18 亿元,同比增长 35.90%。我们认为,随着数据中心行业的快速 发展和公司品牌运营建设能力的不断增强,公司收入有望持续快速增长。净利润来看,公 司 2022 年 Q3 净利润为 3.46 亿元,同比增长 103.42%。营业利润为公司利润的主要来源, 主营业务突出,具有良好的盈利能力。我们认为,随着下游客户行业需求的不断增长和公 司数据中心产能的不断提高,公司盈利有望持续提升。
具体来看,润泽科技盈利能力的持续提升主要驱动因素如下:1)数字化驱动下游行业需 求快速增长,市场规模不断扩大。一方面,互联网行业客户由于自身业务发展的需要,对 数据中心资源需求旺盛;另一方面,5G、云计算、大数据等网络架构的迅速演进和网络应 用的不断丰富也产生了大量的数据中心机房和带宽需求,我国 IDC 业务市场规模连续高速 增长。2)机柜数量增加产能提高,数据中心上电率快速爬升。公司投入使用的数据中心 共有 8 栋,高标准机柜约有 46,000 个(根据 A 栋完成情况推算)。公司产能的不断提高, 适时的满足了下游客户需求的增长,为企业的盈利能力提供了坚实的基础。同时截止 2020 年底,公司整体机柜上电率超过 75%,高于同业万国数据、世纪互联和秦淮数据等公司, 具有较强竞争优势,上电率抬升带动 IDC 收入增加。
3)积极拓展优质客户,客户需求不 断增长。2018 年-2021 年 10 月,润泽科技前五大终端客户的营收占比分别为 92.12%、92.39%、 92.50%和 94.21%,其中最大终端客户字节跳动业务占比较高超 60%,主要由于其近几年业 务发展较快,导致其对数据中心需求持续增加。同时与第一大客户中国电信及第二大客户 中国联通保持稳定良好合作关系。
优质机柜布局为“核心资产”,机柜规模行业领先。润泽(廊坊)国际信息港于 2010 年正 式投资建设,润泽国际信息港位于廊坊国家经济技术开发区,地处京津冀经济圈、环渤海 经济圈的中心。项目规划建设 22 栋、约 100 万平方米高等级数据中心,可容纳约 13 万架 机柜。目前已建成投产的机柜数量约 4.5 万架,正在建设中 5 栋数据中心共计约 3 万架机 柜,润泽(廊坊)国际信息港 A 区全面建成后,总建筑面积 55 万平米,容纳近 7 万架机 柜运营,单园区规模位居全国前列。该数据中心布局较早,扩容空间充足,可供终端客户 根据自身业务的迅速发展直接在本地数据中心扩容,承载更多的数据量,为客户提供优质 的服务。
复制润泽(廊坊)国际信息港成熟发展模式,全国布局建设五大新数据中心。2020 年开 始润泽科技在长三角、粤港澳大湾区和成渝经济圈布局大数据中心产业集群。目前长三角•平湖润泽国际信息港项目、润泽(佛山)国际信息港、润泽(惠州)国际信息港、润泽 (西南)国际信息港和润泽(兰州)国际信息港均已动工建设。润泽科技数据中心项目布 局均位于大数据中心国家枢纽节点,符合国家数据中心建设布局,依托廊坊的开发经验在 全国复制推广,区域优势与规模效应显著。
自建电站、自建综合管廊,提供稳定强劲电力引擎。电力供应作为公司数据中心建设的三 个必要条件之一,润泽科技已在全国布局项目电力供应保障。廊坊地区除了政府配套的多 路市政供电,2021 年公司已投产一座用户自用 110KV 变电站,2022 年开始投建一座 220KV 变电站。长三角平湖园区 2022 年 7 月已投产一座用户自用 110KV 变电站。
液冷机柜已有布局。公司已经做了浸没式液冷和冷板式液冷实验机房,其中浸没式液冷, PUE 指标非常好,但是结合用户侧的需求,大规模商用还需要时间来培养。冷板式液冷是 公司未来的一个主流技术方向,客户对此接受程度较好,已经开始准备批量交付液冷机房。
5.2.奥飞数据:
持续快速发展的 IDC 领先厂商。奥飞数据成立于 2004 年 9 月,是专业的数据中心业务运营商和通信综合运营企业,已在数据中心领域深耕十数年。近年来,公司屡获荣誉,并连 续两年获得中国电信年度 IDC 优秀合作伙伴。2018 年 1 月,公司在 A 股创业板上市。公 司持续深耕 IDC 领域,目前已成为行业领先企业之一,核心机房资产保障发展基础,绑定 大客户快速成长。
公司是多家互联网巨头的 IDC 服务提供商,客户包括搜狐、网易、阿里巴巴、快手等巨头 公司。奥飞数据具有较强的客户群体,根据奥飞数据招股说明书,公司 2014 年开始与 UC 开展业务关系,同时前五大客户还包括风行、网宿科技、乐视网,而后 2015 年搜狐成为 前五大客户之一,同时 2015 年首先与广州市百果园网络科技有限公司达成合作,后续又 与其关联企业开展了合作,2016 年广州百果园成为公司前五大客户之一。2019 与 2020 年 公司继续拓展强大客户,与快手和阿里巴巴等签订合作协议。目前公司客户阵容强大,持 续增长的互联网数据存储需求将助力公司业务发展。
公司与阿里巴巴、快手以及百度建立了合作关系。公司持续拓展 IDC 批发业务,2019 年 与快手关联公司北京达佳签订了《数据中心模块合同》,合同金额约 3.3 亿元,之后 2020年公司与阿里巴巴建立合作关系,签订合作备忘录,并于 2021 年签订合同,金额为 5 亿 元。21 年 9 月与 22 年 2 月,公司与百度先后签署两项合作意向书,就公司廊坊固安数据 中心/广州南沙数据中心项目合作达成意向,两项合同预计总共贡献收入 9.5/10 亿元。上 述合同的签订让公司成功与互联网巨头建立了合作关系,保障了公司未来数年的收入。
公司在全国数据中心布局热点地区具有众多机柜资源,截止 2021 年末公司在全国各地接 入了数十个高标准数据中心,机房总使用面积达到 125000+平方米,可提供 19900 机柜资 源。区域布局涵盖海南自贸区、粤港澳大湾区、长三角地区、京津冀地区等核心区域。该 类区域机房资源已成稀有资产,公司坐拥核心区域机房资源具有先发优势与行业核心竞争 能力。截至 22 年 5 月,公司在广州、深圳、北京、海口等核心地段均布局了自建与非自建机房, 提升公司 IDC 服务能力,未来公司仍将大力推动 IDC 数据中心的建设,完善机房布局,推 动业绩不断增长。
5.3.科华数据
科华数据股份有限公司前身创立于 1988 年,2010 年深圳 A 股上市(股票代码 002335), 31 年来专注电力电子技术研发与设备制造,是行业首批“国家认定企业技术中心”、“国家 火炬计划重点项目”承担单位、国家重点高新技术企业、国家技术创新示范企业和全国首 批“两化融合管理体系”贯标企业。公司作为中国极具影响力的高安全数据中心提供商,拥有 10 年以上 IDC 行业运营管理经 验,主要客户包括三大运营商、腾讯等大型互联网企业、各大金融机构、政府机关等。在 金融领域,公司全线入围 UPS、微模块总行级选型,护航国有六大银行及兴业银行、交通 银行、招商银行等商业银行,证券、保险等金融机构的 100 多个省级数据中心机房,打造 中国金融业首个模块数据中心、高压直流供电数据中心、集装箱数据中心,及全球首个轨 道机器人巡检数据中心。
同时,公司产品方案入驻腾讯、百度、优酷、科大讯飞等国内大型互联网企业,中科院超 级计算青岛分中心、国家测绘局、国家工商总局、中国航天二院、清华大学、中国科学院、 中国商飞、平安集团、中冶集团等项目,全面支撑通信、互联网、政府、金融、教育等行 业信息化与数字化建设。根据计世资讯数据显示,科华数据在 2019-2020 年中国微模块 数据中心市场份额排名第一。
公司目前数据中心相关收入主要包含:云计算业务、数据中心产品销售,以及承接数据中 心 EPC 等。 公司为用户提供高安全数据中心云基础服务,支撑金融、互联网、运营商、政府、教育、 医疗等行业信息化建设,帮助企业实现云端迁移。公司凭借专业团队为客户提供从规划、 采购、建设、维护、运维多个维度分析,从而实现全面且合理的成本控制。 随着公司自建数据中心建设规模的扩大,公司数据中心机柜规模稳步上升,截至 2022 年 半年报,在北、上、广等地拥有 8 大数据中心,自持机柜数量 3 万多个;在全国 10 多 个城市运营 20 多个数据中心。
公司新能源业务包括储能、光伏等可再生能源应用领域,主要产品包含光伏逆变器、光伏 离网控制器、储能变流器、离网逆变器等产品及相应配套系统解决方案服务。目前,公司 储能装机量超过 1.1GW,连续六年入选全球新能源企业。储能作为综合能源系统的枢纽,是公司新能源业务未来的发展重点,公司已在发电侧、电网侧、用电侧以及微网储能等领 域进行布局,满足客户及市场对于稳定、高效、绿色电能的需求。
公司在新能源领域进行市场细分,推出针对性解决方案。光伏发电领域,公司拥有领跑者 解决方案、智慧“光伏+”综合解决方案、光伏扶贫电站系统解决方案等五种方案,和不 同场景、不同规模下光伏发电需求实现对接。以领跑者方案为例,公司针对水面、平坦地 形、复杂地形三种环境场景推出不同的搭配方案,缓解地形缺陷对发电效果的不良影响; 在储能领域,公司立足于用户侧储能、发电侧储能和微电网系统,覆盖户级、村级、乡镇 级、城市级、海岛级各个规模,具有较好的市场适应能力。
5.4.英维克
温控设备领先厂商,技术积累赋能产品/客户拓展。公司下游行业布局丰富,产品与服务 广泛应用于数据中心、通信、智能电网、储能电站,新能源车、轨道交通、冷链运输,智 慧教育、家居、医疗等行业,服务如三大运营商、Sprint、软银等运营商以及腾讯、阿里 巴巴、秦淮数据等客户。丰富的下游应用领域布局助力公司业务持续增长动力强劲。公司产品布局广泛,围绕温控拓展不同应用系列。英维克产品围绕精密温控节能产品拓展, 应用领域包含数据中心机房、储能、机柜、冷链等。目前公司已基本构建了从热源到冷源的设备散热全链条的技术平台,并逐渐完善健康环境的多维度空气质量管理的技术平台, 具备针对不同下游细分市场及行业大客户快速提供个性化需求的产品和方案的能力。
推出 XGlacier 液冷系列产品。公司推出 XGlacier 全链条冷板式液冷系统,采用集成冷板式 液冷技术、高效变频水泵、温水冷却技术达到高效制冷效果,同时充分利用自然冷源,做 到极致节能,CLF 低至 0.03。该方案适用于集中式和分布式液冷系统,在 2021 年实现单 机柜 200kW 超高功率密度算力服务器全液冷批量交付,并荣获“数据中心科技成果一等 奖”。推出六大制冷方案,赋能东数西算建设。英维克高效制冷产品和解决方案在“东数西算” 多个集群中已成熟应用,根据各区域枢纽数据中心对 PUE 的不同需求,在系列数据中心冷 却方案中,精选出 6 种高效节能方案。六大高效制冷方案因地制宜,助力机柜能耗的降低, 赋能东数西算的建设打造。我们认为英维克凭借全方位高效率的制冷解决方案,有望在“东 数西算”未来落地建设中广泛应用进一步提高品牌知名度,提升市场份额。
已有丰富的项目经验。英维克的制冷解决方案已在多个节点有项目经验,XFlex 间接蒸发 冷却机组产品已批量应用在河北、山西、北京、张北、深圳等多个数据中心中;此外宁夏 中卫的美利云项目采用 XFlex 蒸发冷却系统及 XStorm 风墙系统,实现节能减耗,显著提高 能源利用率。