随着数字经济的发展,数据已经成为新时代的重要生产要素,并成为国家基础性战略资源。不久前印发的《中共中央国务院关于加快建设全国统一大市场的意见》提出,加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。与此同时,各地纷纷加快数据立法进程,促进数据要素的开发利用,激活数据要素的价值,保障数据安全和规范流通。
当前,如何激活数据要素的价值?如何完善数据确权?数据交易还存在哪些困境?我国在数据立法上还存在什么问题?如何推动数据供给?针对这些问题,记者日前采访了浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林。
数据确权是数据市场交易的前提
“制度是激活数据要素市场的决定性因素。”盘和林表示,数据要素流通有安全性的要求,所以需要建立完善的制度来监管数据流通,否则将导致严重的隐私泄露。同时,制度也是为了规范数据要素交易,实际上,没有制度,也会有数据交易,只是大量交易将存在于灰色和黑色地带,这样的数据交易是不可控的,并最终会给社会带来不可挽回的负面影响。所以一方面是将数据要素交易市场纳入正规渠道;另一方面是以制度规范数据要素交易行为,让安全隐私保障成为数据要素交易的标配。
盘和林表示,生态是激活数据要素市场的重要性因素。数据要素流通的目的是释放数据价值、有序利用数据资源,而形成生态就是为了更好地应用数据资源,让更多市场主体参与进来,对数据要素各个环节进行填充,丰富和活跃数据交易。此外,数商(中介)是激活数据要素市场的关键。数据要素供需匹配十分复杂,这中间有大量的资源匹配工作,大多数数据需求是定制化的,若没有数商对数据进行收集、清洗、整理、标注、打包,很多数据是达不到可交易条件的,没有数商,数据价值既不能在供给端被发现,也不能被需求端所接纳。
“数据确权是数据市场交易的前提,任何市场交易的对象都是产权明晰的标的,只有产权明晰,交易才会实施,交易对象的价值才会得以释放。”盘和林表示,可以从几个方面来完善确权体系:
其一是划定个人信息隐私和公共数据之间的边界。我国颁布的《个人信息保护法》对个人信息保护有额外的要求,当前个人信息泄露的问题比较严重,要加强对个人信息的管理,尤其是在个人信息使用方面,要对个人信息进行脱敏,所以要在信息数据产生的时候就对个人私有信息数据和公共数据加以区分,采用不同的管理路径。其二是多从需求方来倒推数据权属。“谁投入,谁贡献”是从供给侧,而“谁受益”是从需求侧,由于很多数据需求都是定制的,数据在使用的时候目的不同,其权益分配规则和数据责任也不同。其三是以案例来确权,案例积累能够为数据交易带来更有参考价值的权属认定标准。
数据交易仍存诸多困境
在盘和林看来,随着数据立法的完善,数据法治化程度有所提高,但依然存在诸如数据立法操作性不够强、数据交易所渠道数据交易的种类单一、数据泛化交易和法律红线的边界不够清晰、规则过于保守、创新性不足、数据权利不清等问题。
这就致使数据交易依然存在诸多困境,其一是数据集中。数据是一种资源,在积累到一定规模后,通过算法挖掘能够获得数据价值。互联网提升了数据量级,催生了数据应用,数据量级越大,数据价值越高。收集数据的互联网巨头往往掌握了大量数据,他们并没有动力主动将数据出售给数据的需求方。针对这样的问题,盘和林表示,一方面,要向供给侧施压,逼迫数据拥有者主动去分享,但是这往往很难实现;另一方面是需求侧激励,让需求方具有更多数据交易竞争优势,诸如排他性交易(只有一个客户)、官方定价等。
其二是数据定价。数据定价并不存在公平、均衡的价格体系。由于数据需求方是定制的,数据要素对需求方的效用是不同的,所以不同的数据需求方会有不同的定价。而数据的供给端存在数据权利集中现象,他们在市场交易中有优势,导致数据流通的意愿不高。数据定价要防止“价格敲诈”,防止数据拥有者利用数据支配地位进行不正当竞争。针对这种情况,盘和林表示,数据定价要区分数据的类别,要根据种类看数据定价的优势在供给方还是在需求方,供方有利则定价原则偏向于需方,需方有利则定价原则偏向于供方。
其三是数据应用促创新。一方面,释放数据要素是为了强化创新。未来,从数据到人工智能,从智能终端到数据回传,循环往复。数据、智能的循环对于科技进步至关重要。另一方面,当前数据交易的立法规范集中于供给侧。针对数据交易规则进行限定,同样限制的还有数据交易的种类和参与主体。数据需求方对数据的需求是极其个性化的,诸如语音AI和人脸识别AI的数据需求完全不同,自动驾驶视觉AI和智慧城市监控探头的数据需求也完全不同。当我们限定了数据交易的种类和主体的时候,实际上也会限制创新。如果要让数据推动创新,则需要让数据重新回到开放、共享的原始状态。
要以需求推动数据供给
“要以需求推动数据供给。”盘和林表示,缔造需求,再适配规则,就如同古代鼓励农民开荒,开荒后最初几年免赋税。数据领域交易极其复杂,数据交易主体多、渠道多、模式多,成文法条的可操作性不高,而在遵守原则的背景下以判例和案例作为范本,能很好地为数据交易划定边界和红线。在立法上,要提出原则性的法律定义,在执法上,可以参照案例的方式来执法。
以需求划定数据权属边界。数据权属认定要从需求出发,因为数据交易太复杂,尤其是数据应用定制化需求的特性。如利用公开信息来倒推个人隐私,那么这个数据应该是个人权属,属于个人的隐私权益。如果用公开信息来进行社会学分析,那么属于公共数据利用。
此外,破除数据集中需释放供给端。数据拥有者会以泄露用户隐私、影响数据安全为由,拒绝数据流动,从而最终让数据囤积在自己手中。数据市场的大买家往往是那些头部互联网企业,他们拥有数据,还要大量购入其他企业手中的数据,以此增加手中数据的信息维度。为此,应遵循信息获取最小化的原则。数据需求方不能获取额外的数据量。如果超过了可以拥有的数据量,要么拒绝收集,要么将数据向中小科技企业转售。现阶段,大多数人看到“信息获取最小化原则”都是考虑到供给端,也就是收集必要信息,但在需求侧,这个原则同样有用。(苏德悦)