4月25日,在2024年中关村论坛年会上,北京市经信局、北京市网信办组织相关单位建立北京人工智能数据训练基地监管沙盒机制,依托北京数据基础制度先行区、北京人工智能数据训练基地提供的可信空间和强大智算资源,形成多项人工智能训练数据应用创新机制,向大模型企业模型训练提供“强大算力+海量数据+监管合规”的完整训练要素,成为我国首个将监管沙盒机制应用于人工智能领域的成功案例。
据北京市经济和信息化局副局长、一级巡视员毛东军介绍,监管沙盒是在风险可控的前提下,通过设立限制性条件和制定风险管控措施,允许创新产品技术服务或商业模式在真实市场环境中,以真实用户为对象进行深度测试的一种机制。在人工智能领域,监管沙盒机制是探索人工智能可控发展的创新手段。国际上,欧盟近期颁布的《人工智能法》,明确要求其成员国创建人工智能监管沙盒,挪威、西班牙等国也已经开始监管沙盒相关工作。
在国内,北京率先探索和实践监管沙盒创新机制,《北京市关于加快建设全球数字经济标杆城市的实施方案》《关于更好发挥数据要素作用进一步加快数字经济的实施意见》的文件中,已明确支持打造监管沙盒创新机制。
2023年底,北京市经信局、北京市委网信办联合印发了《北京市数据流通与安全治理监监管沙盒通用实施方案》,以及《智能网联汽车、医疗健康、人工智能大模型三个数字经济重点领域监管沙盒实施方案》。此次发布的《北京人工智能数据训练基地监管沙盒成果》,就是北京市人工智能大模型数据流通与安全治理监管沙盒实施方案的重要探索与实践。
今年的3月29日,北京人工智能数据训练基地正式启用,并配备建立了监管沙盒机制,向大模型企业的模型训练提供强大算力+海量数据+监管合规的完整训练要素,这是全国首例人工智能领域监管沙盒,开创国内人工智能产业创新机制先河。
训练基地内制定了人工智能数据训练基地、监管沙盒运行规则,通过弱版权保护政策,通知移除规则、创新纠纷解决机制,风险补偿等创新政策,降低数据版权风险。在数据存储安全、数据加工安全、数据交付安全、数据监管合规四方面,采取强技术安全保障措施,降低数据安全隐患。同时,训练基地监管沙盒还将为企业提供申请入盒、完备性审核、方案评估、训练验证、初核与退核、成果转化与宣传推广等全流程服务。训练基地依托北京数据基础制度先行区提供的可信空间,为数据企业提供了复杂权属的数据交易、使用的环境,为模型企业提供了大规模、高质量中文数据使用合规途径。
在管理上,利用监管沙盒管理机制,帮助企业在合法合规的范围内规避数据风险,为大模型的规范训练和价值挖掘保驾护航。
在技术上,通过数据加密、脱敏技术、云桌面操作、安全管理等先进技术,为模型企业和数据企业提供了坚实的基础保障,真正实现了数据的可用、可见、不可得,避免数据泄露等高风险事件。训练基地监管沙盒的具体运营由北京国际数字经济治理研究院、北京国际算力服务有限公司、北京国际大数据交易所三方共同承担,分别主要负责监管沙盒机制、基地运营机制及数据交易规则。
4月19日,在北京人工智能数据训练基地监管沙盒机制建立后,人工智能大模型训练营第一期正式启动。同方知网、希尔贝壳、北京车网等14家数据企业,及稀宇极智、中科闻歌、网智天元等3家模型企业,共计17家企业成为首批入盒试点企业,训练营一期引入近20个人工智能大模型高质量数据集,数据总量逾7000GB,覆盖多模态语料,涉及近10个领域的应用场景,这些数据企业和大模型企业将在监管沙盒机制的保障下开展模型训练,在秉承“开放、融合、安全、共赢”原则的基础上,切实推动高质量数据的价值释放,助力人工智能大模型迭代优化,促进数据模型协同合作,实现价值共创。
文/北京青年报记者 温婧
编辑/樊宏伟