创新引领可信数据空间建设
经济日报 2024-11-30 10:00

当前,以人工智能为代表的新一轮科技革命和产业变革深入发展,数据驱动的人工智能发展应用与我国经济社会数字化转型形成历史性交汇。数据源于经济社会并赋能经济社会,其作为基础性战略资源的作用越来越受到重视。与土地、资本和劳动力等传统生产要素相比,数据是可重复使用的资源,而且是新型生产要素。闲置的资源要素是不会产生效益的,数据开发利用才会产生价值。数据有多种类型,对数据的开发应用也有多种模式,具体包括如下几方面。

一是政府掌握的公共数据。通过过滤和去标识化后经合规审查不涉及国家机密、企业秘密和个人隐私的数据可以向社会开放。为了降低社会使用门槛,还需要规范标准接口,提供数据资源目录以便快速检索,如果能配套提供数据挖掘工具软件则更方便数据开发利用。

二是企业掌握的与其竞争力密切相关的数据。很多垂直行业的企业拥有大量数据,但对数据的开发利用能力不足。考虑到这类数据属于企业机密,可构建一个企业可控的数据平台,吸引外部IT企业入驻开发数据,同时保证数据及开发结果不外泄。

三是供应链上下游企业的生产计划统计数据。这些企业间数据的协同对精准制造、降低库存及资金链与物流的及时保障尤为有效,以链长企业牵头构建产业链上下游企业间共享的数据平台将实现互利共赢。平台提供数据聚合和分析的技术支持,同时接入认证机制以便限制向供应链外的企业开放,允许接入的企业也要承诺从平台获得的数据不挪作他用,通过智能合约来约束。

四是行业共性产品和零部件及原材料等基础数据。行业联盟或中介机构收集国内外相关数据、集中在一个行业数据平台上,可作为“工业淘宝”类应用,将便利供需企业间查询和交易。该平台还可集成各类设计工具软件及IP库,显著提升产品设计和开发的效率与质量,平台以有偿或优惠的云上服务对外开放。考虑到数据的异构性,需要有配套数据格式和协议转换技术支持。此外,交易清算结算服务也是基本能力。

五是以数据沙箱模式建设可信安全数据流通平台。数据提供方将加密数据放到数据沙箱,向授权的数据使用方指派密钥,可在数据沙箱内解密计算或直接进行密文计算,以数据“可用不可见”的方式互惠或有偿使用数据。数据使用方也可以是数据开发方,通过自带相应大模型或同时加入自身数据微调与推理,在沙箱内完成数据开发并获得相应结果,自始至终数据提供方的数据并没有离开沙箱。

六是跨境数据流通管理平台。按照数据跨境流动管理规定进行数据合规管理,包括对境内数据提供方和境外数据使用方的身份认定、申报数据的安全评估和存证备案、个人信息敏感性的识别和个人信息保护认证等。跨境数据流通对境外接收方有明确要求,他们需承诺合法使用来自境内的数据、具备提供保护境内数据的能力并承担对这些数据的保护义务。国内跨境数据流通管理平台也需要具有对出境后重要数据的安全管理能力。例如,支持境内数据提供方对出境后重要数据密钥的权限管理,发现境外使用者对数据的使用有安全风险时,可以遥控改变密钥保护数据。

上述多种数据开发模式催生了可信数据空间,它是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。可信数据空间将集成上述各类数据开发服务平台所需的功能。首先是数据资源查询检索服务,提供统一规范的数据目录、标准化的访问接口以及可智能搜索的数据产品、数据格式和协议的转换工具等。其次是数据融合和应用开发环境,提供适合行业特点的人工智能基础模型供推理应用,提供集成、分析、清理或语义丰富等附加数据服务,还可配备设计工具软件与IP库及低代码开发工具等。再次是可信数据安全保障服务,创建、维护、管理和验证参与者的身份信息,提供数据属性认证、数据流通路由溯源,基于区块链对数据来源追踪、隐私计算和使用控制等。

可信数据空间的应用需要数据提供方和数据使用方进行相应的功能升级,配备接入可信数据空间的专用网关,提供软件和应用程序的可信环境,跟踪数据来源,允许参与者加入使用策略并强制执行,需具有对重要数据加密管理能力包括采用同态加密密钥。同时,还需要外部环境的配合,支持可信数据空间运营者与数据开发、数据经纪、数据托管、价值评估、审计清算、合规审查等数据服务方开展合作,更好地实现流通交易价值服务。

可信数据空间的建设需要政府与市场各司其职,政府建设以公共数据为主要资源的城市或区域可信数据空间,重点企业和行业龙头企业依据自身拥有的数据资源建设企业和行业的可信数据空间。个人可信数据空间指专注于消费者大众的个人数据开发利用,并非由个体自然人建设。城市主管部门收集的市民数据可在政府主导建设的个人可信数据空间内脱敏或匿名化处理后应用,电信运营商、互联网企业和金融机构等也积累大量个人数据,可以脱敏或匿名化处理后包含到企业的可信数据空间内,但需要特别强调尊重个人意愿、保护个人权益,依法提供依场景授权许可的个人数据转移流动和开发利用服务。

可信数据空间是面向人工智能时代数字化转型的重要创新,也是数据价值开发与流通管理的重要平台,需要从法规、政策、标准、技术、运营、管理多方面着力建设。考虑到数据跨境流动的需求,可信数据空间的国际化和国际合作是应有之义。可信数据空间的生态链很长,不能等生态完善后才开始推动部署,也不能一哄而上,问题发现、市场培育和方案解决都来自实践,积极试点、鼓励探索、及时引导、统筹推动尤有必要。

国家数据局最近发布的《可信数据空间发展行动计划(2024—2028年)》对可信数据空间给出清晰的定义,以深化数据要素市场化配置改革为主线,以推动数据要素畅通流动和数据资源高效配置为目标,提出到2028年建成100个以上可信数据空间,初步形成与我国经济社会发展水平相适应的数据生态体系。《行动计划》还分别就实施可信数据空间能力建设行动、开展可信数据空间培育推广行动和推进可信数据空间筑基行动部署任务,并提出一系列保障措施。《行动计划》内容全面、重点突出,既有明确的政策导向又鼓励探索试点,为我国可信数据空间的建设给出及时指引,提出数据技术、数据产业、可信运行和安全管理等创新方向。可信数据空间作为新型数据基础设施是数据生态体系的重要组成部分,在国际上尚无体系化部署和应用的经验,期待我国在《行动计划》指引下形成一批数据空间解决方案和最佳实践,构建“供得出、流得动、用得好、保安全”的数据生态,为数字经济发展提供源源不断的活力。

文/邬贺铨(中国工程院院士)

图源/视觉中国

编辑/姬源

最新评论