多地数据交易所上马,数据要素将会如何交易?
导读:受到市场需求的推动和政策的支持,2021年至今,北京、上海、福建、重庆等多地筹建或已建成数据交易中心。据不完全统计,目前全国已有超过30个数据交易中心。
经济观察报 记者 宋笛
“据我们不完全统计,新型数据交易所现在差不多有十多个正在筹建或上线了”,数牍科技副总裁张迎春说道。
2020年,两办印发《关于构建更加完善的要素市场化配置体制机制的意见》,其中提出“加速培育数据要素市场”;2021年11月,工信部印发《“十四五”大数据产业发展规划》中进一步指出“培育大数据交易市场,鼓励各类所有制企业参与要素交易平台建设”。
受到市场需求的推动和政策的支持,2021年至今,北京、上海、福建、重庆等多地筹建或已建成数据交易中心。据不完全统计,目前全国已有超过30个数据交易中心。
数牍科技是一家以隐私计算服务为主要业务的科技公司,专注为数据要素市场搭建底层基础设施,参与了上述多个数据中心的建设,也是北京、上海、深圳、重庆、合肥等地政府首批数商及首批生态成员。
数牍科技创始人&CEO宋一民介绍,“我们其实是做隐私计算技术本身和技术运营的相关工作。数据交易涉及到大量价值挖掘或价值发现,技术是挖掘的主要工具,我们将隐私计算技术工具化,提供给真正主导交易的市场主体或平台,实现数据交易价值最大化。”
在张迎春看来,当这些数据交易中心搭建完成后,就需要面临如何做活市场的问题。这其中,供需市场和相关规范将会逐渐形成,政府、技术公司、市场需求方也会陆续完成分工。
数据交易中心新浪潮
2022年4月10日,中共中央、国务院印发《关于加快建设全国统一大市场的意见》,其中提出,要加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。
数据是统一大市场中一个重要的组成部分,在张迎春看来,数据要素市场包括三个部分,一是数据要素的分享;二是数据要素的开放;三是数据交易,即数据作为要素,可以被定价,可以被确权,可以被交易。
在这三个方面,各地政府正在积极发挥作用,特别是在数据交易方面。
2015年贵阳成立了全国第一个大数据交易中心,中国场内数据交易开始出现。但在接下来的数年时间中,无论是数据的场内交易还是场外交易,都面临着诸多“堵点”,比如场内交易的活跃度,场外交易的安全监管等。
受到数据要素相关政策的推动,2021年至今,北京、上海、深圳、重庆、合肥等地均已筹建数据交易中心或抛出相关规划,形成了一波建设浪潮,这些数据中心的建设以地方政府为主,在数据交易层面、标准和方式上与此前均有所不同。
数牍科技参与了其中一些地区级和国家级数据交易所的建设,这些交易在目的上体现出了区隔。区位优势、资源禀赋较好的一线城市,建设数据交易所的痛点在于体制机制的搭建,这些数据交易所希望能够在前沿创新上有所突破,而其他城市数据交易所的核心诉求则在盘活当地的数据市场。
此外,目前数据要素市场也存在一些潜在的结构性分类。
一个问题在于要素市场条块分割的情况依然存在。所谓“块”即数据的地域性,“条”即数据的行业性,这种条块分割给数据的流通带来了阻力。比如,如果一家商业银行需要公共数据应用于金融领域,但每个省的公共数据都需要与所在省的交易中心沟通,其中又涉及大量的交易结构和权责分类,会增加额外的交易成本。
数牍科技方面认为,目前数据市场的建设不仅有条块分割的问题,也有区域发展不平衡的问题,要解决这些问题,需要技术等各方面的参与。
“技术解”
数据交易中心建设只是第一步,在推进数据要素流通的过程中,各地还面临着更多挑战。“我们每帮一个地方(数据交易中心)服务,都会跟当地讲,数据要素市场其实不单单只是交易的问题,还要解决供需,供需的背后可能有数据共享的问题,可能有数据开放的问题,可能还有数据交易的问题,甚至一些同意授权管理、数据确权、数据定价等其他方面的问题”,张迎春表示。
与其他要素市场不同,数据的一个特别之处在于所有权和使用权难以分割,由此带来了确权、定价等节点。此外,数据交易在实践中还面临隐私保护、安全等多方面约束条件。
以数据的定价为例,此前数据交易的定价缺乏一个公允的标准,主要以经验判断为主,难以量化。
在数牍科技方面看来,数据要素的流通需要在安全和发展两方面做好平衡,但要做好平衡需要技术的“杠杆解”。“隐私计算其实就是为了破解数据安全和数据要素价值发挥中间矛盾的技术解”,张迎春表示。
隐私计算的本质是将数据的使用权和所有权分离,即利用联邦学习、多方安全计算、同态加密等隐私计算技术让数据实现“可用,不可见”的效果。
在目前这一轮新型数据交易中心的建设过程中,以隐私计算为主的技术服务也成为基础设施的一环。
数牍科技方面介绍,利用隐私计算和区块链等技术的结合,可以实现整个数据流转链条的可信存证,比如谁用了谁的数据,用在什么地方,这个数据在最终使用场景里面发挥了多少价值等,全部是可量化、可被记录、可被认证、可被认定的。
在这个过程中,数据的提供方有自己数据的物理控制权,可以决定数据使用价值要让渡给谁,让渡过程中经过了谁的加工,授权是明确的,最后这个数据的使用价值也是可以被量化的。
目前,数牍科技在配合一些城市的数据中心制定数据的定价标准。通过一些标准和维度,数牍科技能把数据要素的贡献度衡量出来,目前正在若干交易所落地,未来会变成数据定价的指导模型。
“我们可以在买卖双方报价前先看看那个模型大概应该报多少钱,这样所谓的财产权才有抓手。早前也看到过黄奇帆提的‘谁贡献谁受益’的观点,但谁贡献的多少起码要说清楚,我们就想要解决这个问题。从这个角度上来说,我们现在做的事情不单单是隐私计算,我们做的是隐私工程”,张迎春表示。
宋一民介绍,目前数牍科技主要还是提供技术工具,以及与交易所合作做一些标杆案例。
目前,在某地数据交易所核心技术预研项目中,数牍科技做出了包括数据贡献度、数据质量、样本数据等多个维度的指标体系。这些指标可以从数据成本、数据在模型中的贡献度、数据对业务的贡献度、基于隐私计算的历史成交均价等方面,形成一个数据产品全生命周期的投入产出衡量框架。这样一来,虽然数据提供方、数据使用方、市场监管方等不同主体在“数据定价”这一问题上的视角和诉求不同,但都能用数字说话,在指标体系中“各取所需”。
张迎春表示,未来数牍科技还将围绕着数据定价、数据确权、数据资产化来做一些实际的业务落地工作。比如数据资产化过程中要解决的贡献度衡量问题,或者是数据如何成为有效抵质押物的问题。