当前位置:首页 > 创业圈 > 商学 > 论道 > 正文

江小涓最新重磅演讲全文:信息、数据与数字时代的创新(信息量大)

来源:国福商学 发布时间: 2023-07-06 11:48:01 编辑:夕歌

导读:本文由新经济学家智库根据2023年7月4日,中国数字经济发展和治理学术年会(2023)上,中国社科院大学教授江小涓的发言实录整理。

本文由新经济学家智库根据2023年7月4日,中国数字经济发展和治理学术年会(2023)上,中国社科院大学教授江小涓的发言实录整理,略有删改,内容未经本人确认:

上午的报告非常的集中在数据要素市场,我觉得我本人的题稍微分个叉,可能大家进不来那个题目,所以我稍微把刚才的题目稍微回应一下大家说到的一些共性的问题。

一个大家讲到了数据二十条的问题,我是数据二十条制定的专家组长,所以我对这个背景还是比较了解的,我讲一下为什么会出现大家现在想象中的一些缺憾或者是问题。其实我在人民日报专门写了一个解读的文章,我再稍微简要的说一下,大家理解这个市场讨论中间,我们前后有60位专家,完全不一样的就是所有权问题,大家很难讨论出来一致的意见。法律专家对定义要求的严苛,后来我觉得可能就很重了,所以最后的问题我们稍微看泛一点,就叫持有权。它也是关联的一个提法,最后强调了这个市场交易权收益权等等,所有权确实是有意暂时把它淡化了,不是忘掉了。

再一个就是交易的方式,当时大家很多,特别是我们这条线上的比较正式的机构,希望我们多强调场内交易,盖个戳隐私保护对吧?但是我们想象中间的很难操作,后来我们还是把场内场外交易都可以,看你愿意用什么方式来交易,所以场内场外的模式给了一个选项的存在。

还有一个争议的问题就是数据跨境交易,有法律规定,所以我们不能随意的去讲,我们给了一个不再加严的原则,就是不会在法律中间再提出更严的加严,然后我留下一个未来探索空间,还有一个就是公共数据的问题。

公共数据量非常大,在目前是一个结构化比较好的数据,市场也比较看重的数据,但是从市场政府的主体来讲,它真的是激励机制不够,它为什么拿出来?对它有什么好处?

所以有人提到过公共数据的有偿的退出,这个问题也比较有争议,一方面想的很有道理,它激励相融了,它有积极性去做,另一方面公共数据如果最后变成这样的方式,可能后续还是会带来比较多的问题。

我们讲了政府手中控制的,以公共治理为原则,拿到我们公民、商业机构很多数据之外,还有衍生的数据。比如我举一个例子,我们有公共资源交易市场,这是政府的一个市场,它把所有政府需要招标投标的项目都拿到这个平台上去,其实量非常大,那么这个数据非常有用,它也不是政府公共利益持有的个人的应有的数据。如果能够把它市场化,市场化以后的效益一定非常有效的。

所以最后就是在公共立场和数据的效益、社会组织方面寻找他的思考,最后我就放掉了,在这文件里面并没有规定公共数据的收费是什么,但是这是个比较突出的问题,我其实专门写过一篇解读的文章,今天稍微说的更直截了当。

我今天要讲的这个话题叫信息、数据与数字时代的创新,我尽可能的简短一点,上午的讨论实在是太热烈了。主题的起因是这样,就是说我们有一个课题总结研究了一段时间了,我们观察到海量数据加入以后,创新范式在有些领域在发生比较根本性的改变,而且把数据加入以后,它提供了一个去观察科学技术经济社会关系的一个新的视角,视角的变化也是非常重要。

那么我们的观点大概是由于数据在创新中间的极端重要性,平台数字企业是数据的生产者使用者和主要的交易方,所以它在创新链条中的地位在大幅提升,但是结论还是非常重要的,将来怎么组织创新?那么由于数据越多,你能链接汇聚的数据越多,项目的研发数据越想越多,所以开源开放的模式将来应该成为一个创新最高的组织方式,大概就是这样一个观点,我先把它说完,然后我来讲一个就稍微讲的快一点。

先看一个例子,在新冠大流行的时期,从世界卫生组织开始,很多机构、大学、药品机构设立了一个包括基因数据序列,临床试验结果,药物公平分配,开放式创新等等,建立了一个开放平台,这个平台非常有效,所有的人都承诺只要有新的专利就马上放上去,然后有新的数据测序出现马上放上去,整个对于我们全球疫情的毒株变异预测,采取措施发挥了非常重要的作用。

举了一个例子就是奥密克戎,这个数据被南非的科学家看到以后,就放到了开放科学平台上,就专门对新冠的一个平台,从第一天发现到宣布一个新的变种出现只有三天,这在往年的疫情流行病学中是出现不了的速度,而且同步被所有相关方知道,这是数据,我就举一个例子。

那么我们今天讲的观点大概是这样,科技创新在不同时代有不同的特点,这是我们创新范式创新理论研究的重要内容。那么长期以来观察创新范式的重要问题维度,就是社会科学技术和经济社会之间的关系。这也是我们创新实践受到关注的很多的大的问题,就科技成果的转化长期是一个痛点。其实背后就是我们这个关系怎么处理,数字时代的科技创新有了重要的新变化,这个变化不是原来年度的调整,它完全是一个新的海量数据新维度的加入,数据就成为了创新的重要资源,它也重新定义了创新各主体之间的关系。

那么分析这个变化,我们要构建一种新的创新范式的分析框架,这是我们创新理论研究的需要,其实有非常重要的现实。我们现在讲集中力量办大事,讲一个主题科研,到底谁是枢纽,谁是头部。

一、传统视角的创新范式:科技供给和需求

首先我们看一下科技创新范式的一个传统的视角,它就是以科技供给和需求,是科学技术这样往前推,还是需求产业这样往回拉,不管他解释的怎么来命名,这是我们传统的一个视角是。

第一代就是技术推动的需求往应用方走,第二代就是需求拉动往回涨,第三代就是多项的互动,第四代就是由于数据更多之后,很可能在企业层面它是一个平行的过程,第五代大体上就有点像我们数字网络时代来讲的,它是一个数据的汇集,这是我们其实说创新范式有很多,我觉得这个还是用的最多,而且解释的也比较好的一个传统的理论。

长期以来在这个模式下就是我们讲的问题了,科技成果向产业应用的转化是一个突出的问题,这是国家的正式报告,我们有效发明专利的产业转化率高校只有3.9%,我们做了那么多的事情,96%没有结果。

花那么多钱,当时要钱我就不想给高校,做的东西也没什么用,科研当然我们只讲有用,这个有点错了,科学它是一个非常伟大的和人类对自身对世界理解有关的东西,但是我钱有限,创新驱动发展要有点成果,科研单位好一些,企业来做最好。

那么我们到了数字时代,当我们发现数据在创新空间这么重要的时候,我们回望一下过往,我们发现用数据的一系列特征来定义不同时代的创新,是一个很好的办法,它很有效的解释了不同阶段的创新。简单说一说,我们在工业革命之前它就是信息传得很畅,所以才有科学自己玩自己的技术,自己实践出真知,他没有办法互相知晓,所以他没有办法互相关联。

二、信息视角的创新范式:以信息特征和信息关系为主线

那么到了信息传递技术的发展,比如通信,然后载体的丰富,比如学习期刊的出现,这样两者之间三者之间才有一个关联的可能性。这时候科学家就是我现在发明了,我就是为了发明设计更好的机械设备,这样产业的技术行家也可以关注科学的进展,大概有100年是在这种关联下相互来推动的。

那么反馈就是我们对应的是消费者需求端拉动的时候,当大规模的标准的产业化形成之后,用户反馈才有意义,如果都是逆行的,一人一户那种反馈是没有问题,所以都是和数据相关,我们来解释不同时代的创新的特点。

然后我想抽取一些基础元素,信息重要到底是哪些信息来影响创新?我们抽了一些维度,一个就是你的信息生成传递和获取的能力是不是快,比如现在我们在线阅读快于纸板的书刊。我们一个老师的观点在当天晚上就变成了100个人的观点,它非常快速的在被分享。社会对科技需求相关的信息的形成也要加快,所以信息的生成传递和获取的能力非常强。

第二就是信息的数量广度和深度非常重要。对于创新来讲,大数据时代的数据数量、广度它呈现出海量和异构的特征,海量提供创新成功的可能性,异构数据其实它对消除认知的偏误非常重要,对科学家理解市场的需求在哪里是非常重要。

然后像信息交互的能力,信息共享的能力,信息越共享越多,越能创造出新的需求端的创新的能力。所以我们研究完了以后,在数字时代影响创新的重要内容大概有七八个,但是这四个是非常重要的,基本可以解释哪个领域创新做得好,哪个领域迭代快,基本上和信息相关的,我们就构建了一个新的范式了,我刚才讲是一个传统的范式,我们大体把信息稀缺时代叫一个分离状态发展,科学技术产业产学研用。在信息时代中有了一个关联,在海量数据时代它变成了一个融合与交互的时代,这是我们想构建一个数字时代新的这样一个创新范式,其实最后还是要回到对政策的导向中去。

三、数智时代的创新:数据主导与企业创新主体地位

我们现在大体上初步的结论就是数字时代的创新,数据主导地位的出现和企业创新主体加强,数字时代数据是重要的创新要素,大型数字企业是海量数据的生成者、使用者、交易者,它在创新链条中的地位是显著的上升。

它汇聚海量数据,能够准确的感知市场需求应用场景,同时大型平台有能力大规模投入。我们投入最多的前三家企业都是平台,不是我们大学。他能组建研发的团队,他要研发的内容可以覆盖产业生态所需的全链全域的技术体系,直接应用于自身庞大的生态圈。

其实这种模式下的创新产业和物流是一体化的,也不存在所谓的科技成果转化的问题。这个问题如果真正的让平台让数字企业成为创新主体,它已经在成为创新主体,那是一个过去的问题。我们举了两个例子,上面的例子是一个车联网的平台,不是平台自己做,只是平台知晓它场景中所有的最新的需求的变化,所以只有他知道,然后他来作为枢纽来组合各个大学机构其他企业来形成一个全场景的研发的能力的投入。

我们原来从科学研究到技术,中间每个链条都是粗细不一样,最后断掉。下边我们只是说一个企业它可以做到一个很长很全的场景的从芯片到操作系统,到服务到很多数据要素,它自己闭环,1000多亿在做。

......

我们点一下,不光是把产业技术作为我的产业技术,由于大型数字企业具有巨量的链接,海量数据的获取,它已经是前沿技术的重要创造者。

我们点到的这些技术里面,我们最上面的研发的发明专利都是企业做的很厉害,包括我们国际发明专利排名前20多的都是完全不能把企业放掉,我们研发技术和应用转化,在数字时代不完全符合实际的情况。数字数据也支持大型企业从事技术研究,他们在这个领域中发挥作用的能力在大大的提升。

另外数据现在变成了独角兽企业投资的最主要的投资者,也和他们知晓相关创新方向的能力有关,他知道我平台技术的发展将来到底在什么技术上是真正的短线,而不是说我有什么我就跟着做什么。跳的最高的,这是腾讯,它的投入可以看很多。在第二位,然后从过去几年掉下去的那是阿里。第三位曾经中间冲过一个高点,然后比较快的下去的那是蚂蚁。

我们看最右侧两个中间的两个偏深色的蓝色的,那是红杉和高岭。在数字里面独角兽企业的投资,这个平台发挥的作用很大,还是来自于他对市场灵感来自于它由于及时数据的获得,对数据市场的敏感。

所以无论从产业应用产业技术,从前沿技术到原始研发到最后的资本投入,由于数据的重要性,使得大平台企业在创新中的地位在大幅度提升。

四、数据汇聚与链接:开放开源配置创新资源

最后我们讲一讲数据这么重要,什么方式什么科研组织方式能够汇聚数据,能够链接数据,我们叫开放科学体系和开源的技术体系,才能够在这个时代最好的配置创新资源。

以前我们是把开放数据作为开放科学5个要素中间的1个,但是到了现在的阶段,开放科学中的开放数据本身很重要,也从连接其他开放部的一个连接体,就是说数据的开放在开放科学中的地位在大大的提升。

我们举几个例子,现在开放科学,现在的真正的大科学项目都是跨国的投入,我们要看那么远,我们要看那么深,要那么多的数据要处理,基本都是大科学项目,最后这种项目能够设立起来,最主要还是海量数据的汇集传递来支撑了我们大科学的项目。

我们举了几个例子,像这些关心科学的人也都能看懂,不关心的人我两句也解释不了。所以就看看图就过去了,总的来讲要有一个非常好的全球的数据平台来分享来共享数据过程。

这是最新的去年前年我们人大批了一单,叫平方公里阵列射电望远镜,它行天速度高很多,我们都希望它能瞅到点什么东西,那么17个经济体我们一起来做,最后还是要靠一个开放科学平台来做,背后是数据的传递和分享,共享和使用。

图片
那么开源技术现在也变得很重要,这是我用了梅院士的一张图,我经过他允许的,我已经用了不止一次了,那么开源原来我们主要还是指的是是软件的源代码的开放。但是数字时代,其实开源要成为一种创新理念和文化形态,它大概指的是共享共创的力量。这种技术创新,我们现在需要数据越多越好,开源可以汇聚那么多的开发者一起在平台上来开发。

开发者在一个平台上是很常见的,它能够允许分布式的协作,接力式开发,推动技术快速的迭代和大脑的连接,产品企业和产业数据的汇聚和数据的使用,通过开源都必然是完全不一样的模式了。数据大家都熟悉,开源发展到现在,我们大部分的开发者,大部分的企业,大部分的新的操作系统,特别是新立项的数字经济的数字技术领域都是移动开源。

那么梅老师讲最近20年云计算大数据和AI的发展也受制于开源,这是他的图,从开放数据到开源算法到开源框架,我再加一句,现在硬件开发非常多,就我要设计一个软件操作系统,你要允许我中间接的所有的硬件不能指定,而是要最大限度的开源。它的好处就是在于我们产业互联网中间,我一个企业的迁移中间不用动硬件,我可以不断的升级和迭代,所以开源硬件也变得非常的重要。

这样我们就把这个模型再稍微丰富一点。除了上面我们讲从信息角度的几个类型,我们下面对产业组织也做了一个分类,以前我们是一个边界封闭的,是闭环合作的,到现在数字时代,边界开放开展模式应该成为创新的一种主流的产业组织的形态。我们讲的这不是理念,经常有人讲说开源,需要开源的精神,需要合作。我觉得开源到现在它是一个和理想并存的一种方式了,越来越多的会跟进到这个方式中间去。

最后是数据能够汇集共享,用数据做基础来做科技研发。我的结论是这样,数字时代,数据成为重要的创新要素了,数据可以重新定义创新,带来的是科技和产业一体化程度的增加,大型数据企业在创新的地位在上升,开源开放成为创新资源配置的重要的组织形态。

现在我们讲创新推动发展,讲发挥我们国家集中力量的优势,讲我们有组织的科研都对,但是一定要适应我们已经变化了的这种科技创新的一种新的范式的改变。谢谢各位。