WAIC 2022丨集四方之智,探索架起数据要素流通市场的“路与桥”

2021年以来,我国陆续发布《“十四五”国家信息化发展规划》、《“十四五”数字经济发展规划》等重要国家数据战略,强调建设数字中国,加快数据要素市场化流通,创新数据要素开发利用机制。

价值的流通是数据要素流通的本意与核心,而制度与技术是激活数据要素的“路与桥”。以技术搭建互联互通数据价值网络,保障数据安全与隐私,实现“数据可用不可见,数据不动价值动”。以顶层设计健全数据产权、交易流通、收益分配、安全治理等数据基础制度体系,构建多维立体数据价值流通体系,是数据要素市场化建设的关键“题眼”。

9月3日,由世界人工智能大会组委会办公室指导,粤港澳大湾区大数据研究院、开放群岛开源社区、智能投研技术联盟(ITL)、FATE开源社区联合主办的2022世界人工智能大会-数据要素流通技术前沿探索论坛上,30余位学术界、产业界、科研及行研机构专家学者与行业领袖齐聚一堂,聚焦数据要素市场培育、基础制度建设,关键技术创新,交流和探讨了数据要素流通的前沿动态与创新成果。

逢山开路,完善数据要素市场化基础制度

数据交易流通的重要性毋庸置疑,但却面临重重困难。各领域机构数据交易业务正处于“蹒跚前行”,乃至停滞状态。原因在于数据要素在资源化、资产化进程中,缺乏数据要素流通基础制度。数据要素共享、流通、交易仍处于小范围、小规模阶段,导致数据要素市场供给不足、流通不畅、应用不深。

国家信息中心原常务副主任、粤港澳大湾区大数据研究院名誉理事长杜平致辞中,针对激活数据要素价值,提出三方面建议。一是注重数据要素产权、供给、流通、监管等多方面基础制度的深化改革,促进数据要素市场化配置。二是建设集约高效的“根服务+公共服务+算力服务”三大数据交易基础设施,建立数据要素技术服务、交易服务和算力跨云、跨域调度体系。三是加快数字化技术研发及成果转化进程。探索元宇宙生态及其商业应用场景,拓展新的数据资源生成空间和数据要素资产化证券化空间。

国家信息中心大数据发展部规划处处长、粤港澳大湾区大数据研究院院长王建冬认为,数据要素市场化配置改革应探索形成以数据要素基础支撑体系为底座的多层级、立体化的数据交易市场体系和数据交易服务生态体系。可从加强数据要素基础设施和标准规范建设、强化公共数据共享开放和新技术应用、发挥政府引导作用促成产业集聚优势、创新完善监管体制机制和信用体系建设以及积极开展数据跨境流通试点示范工程等多方面着力构建全国统一的数据要素市场体系。

中国信通院云大所所长何宝宏表示,数据产权划分、保护、交易流通的滞后引发“数据孤岛”“数据垄断”等现象,为数据要素流通产生阻碍。他认为,培育数据要素市场的核心思路在于健全数据市场规则,厘清数据产权,确定数据价值评估方式,强化隐私计算等关键技术创新,实现数据要素的“殊途同归”。

遇水架桥,发挥隐私计算、可信数据空间等数据流通核心技术作用

专家一致认为完善数据要素市场化配置机制体制,将进一步推动行业发展,定位我国数据要素市场未来走向。而如何通过数字技术创新,在保障原始数据“可用不可见”前提下,安全可信开展数据流通与融合应用,保证跨行业、跨机构的数据使用合规、范围可控,确保数据所有权不因流通与共享而发生让渡,也是当下推动数据要素流通普及、普惠的重要议题。

近年来,快速发展起来的可信联邦学习、多方安全计算等隐私计算技术与可信数据空间正在成为数据价值分享体系的关键技术底座,产业应用实践日益成熟。

中国人工智能学会(CAAI)荣誉副理事长、加拿大工程院院士、加拿大皇家科学院院士杨强表示,可信联邦学习的安全可证明,模型性能可使用,决策可监督,模型可监管以及普惠等特性,为培育高质量的数据要素市场提供基础性技术支撑。然而,想要使数据要素流通更通畅、更安全,开源开放必不可少。

“我认为,开源是数据要素流通产业发展的一条重要’中轴线’,建设并发展开源社区,让更多角色参与数据流通技术生态,是实现技术普及的必要前提之一。”杨强表示,全球首个隐私计算和联邦学习开源社区 —— FATE正不断完善,目前已有 4000 多位个人工程师与开发者,以及 800 多家企业机构参与社区共建。

自2019年FATE社区发布首个开源项目以来,极大加速了国内联邦学习环境及参与方从单兵作战走向生态化。未来,社区将进一步推进并服务于跨平台的互联互通,以及安全机制的建立,从而支持数据确权、定价、模型交易,支持数据交易所和跨境数据交易。

华为公司数据总架构师马运也表示,考虑到数据要素易复制、难确权、难定价、非排他性等特性。数据想要成为生产要素流通,需从数据清洁、共享与可控交换着手,让数据与货币一样在流动中不断增值。

华为从2014年便开始探索与构建真正可让数据放心流动的治理体系与IT平台。目前,华为已构建了企业数据底座,以“管入、管存、管出、管用”的平台能力实现企业内数据的高效共享与敏捷自助,同时构建了EDS企业数据空间,以“可信、可控、可证”平台能力实现企业间数据的可控交换与价值释放。

技术底座之外,数据流通另一个重要的问题在于安全与性能的平衡。诸多数据要素流通技术为最大程度保障数据安全与隐私,引入了大量密码学运算,这使得计算量几何级增加。以全同态技术为例,在通用芯片上密文运算的速度比明文运算慢了10万倍,是导致隐私计算等技术一直未得到广泛应用的根本原因。

香港科技大学教授、智能网络与系统实验室主任、星云Clustar创始人陈凯表示,安全、效率、效果的平衡与统一,是数据要素流通技术走向规模化应用的关键。“以算法与协议创新,算力硬件加速,网络优化加速等软硬件结合技术手段,在保障数据隐私安全与数据建模效果的前提下,提升计算效率是很重要的破局点。”陈凯称,目前实验室与星云Clustar合作分别从这三方面不断提升算力性能:

算法优化方面,提出了一种基于随机掩码的奇异值分解方案。该方案的效率比同态加密提高 10000 倍,误差比差分隐私方案小 10 个数量级,同时提供了安全性分析和实验验证。

硬件加速方面,针对隐私计算应用场景中数据建模、推理、对齐的12种常用密码学算子与2个核心算子,进行了硬件加速,通过FPGA算力加速卡实现端到端30倍以上性能提升。

网络优化方面,通过数据中心内部网络传输与广域网数据传输的分别优化,实现高带宽、低延时的数据密态传输。

“让隐私计算技术为数据价值更高效的应用与挖掘,驱动业务创新服务,为应用方创造增益价值是隐私计算广泛应用的重要因素之一。我们希望未来数据的交易、流通能够在保证足够安全的前提下,实现与明文计算类似的效率。”陈凯总结道。

在圆桌讨论环节,来自中国信通院、粤港澳大湾区大数据研究院、中国银联、中国移动、华为、百度、成飞集团、FATE开源社区、比特飞扬、数鑫科技的多位专家学者与企业代表,分别围绕“互联互通激活数据要素流通生态”、“ 可信数据空间助力数据要素流通”话题展开讨论,并从自身业务与实践角度出发,阐述数据流通技术与数据要素市场的紧密关系。一致认为,为实现激活数据要素潜能,培育数据要素市场,革新数据要素分配机制,架桥铺路,实现数据有序、安全、合规流通将是必然途径。

声明:本站转载此文目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本网站对此声明具有最终解释权。
Copyright © DoNews 2000-2024 All Rights Reserved
蜀ICP备2024059877号-1     京ICP证151088号
京网文【2018】2361-237号