北京青年报

蚂蚁集团发布大模型密算平台韦韬：AI加速数据密态时代到来

北京青年报客户端 2024-07-08 12:27

“大模型真正的问题是缺数据，整个大模型技术往下一步演进，无论是在通用技术领域，还是在重点的专业领域，数据才是决定AI应用能力的上限”，在2024世界人工智能大会上，蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬在接受北京青年报记者等采访时表示，“密算会成为数据可信流通的新算力，整个行业将会从通算、智算走向密算。”

数据价值越大，风险越高

“当没有数据的时候，无论多聪明的大模型，都是做不出决策的，要硬做决策只能盲猜。真正的行业、专业应用问题解决，都是依赖于关键数据的供给能不能按需获得”，韦韬说，比如医疗行业，你要去看病，医生觉得相关信息不足要让你做检查，有了关键数据支撑才能做决策。但是“通用领域应用中，中文语料严重欠缺，专业领域应用的时候专业数据供给更加欠缺，这是整个行业面临的非常大的问题。”

然而缺乏数据，不是因为数据短缺，而是因为数据难以流动。“为什么它流不动？因为数据存在大量的泄露风险和滥用风险。数据非常容易被拷贝、分割、加工、变形，所有高价值数据，对正向业务有价值的时候，在黑产上价值往往更高。”数据价值越大，风险越高。根据调查2023年数据泄露的平均成本是445万美元，创历史新高。“更糟糕的时候，流通时它容易泄露，泄露后又很难追踪是谁泄露的，这件事情导致连带巨大的风险，所以大家不敢流通。”

密算由此成为必然。“整个数据以密算形式流通，保障它在存储计算、运维研发全链路是安全可控的，我们认为这是未来的必然趋势。只有让数据是密态方式流通的时候，才能即发挥正向价值、又控制负向风险。”

针对有说法认为密码学技术成本太高难以应用的观点，韦韬说：“单纯使用密码学技术，成本太高了，导致难以大规模应用，所以我们要用可信芯片和机密计算技术来协同保障，从而大幅度降低成本，实现低成本密态计算，形成行业里规模化应用方案。”

韦韬说，两年前蚂蚁就坚定认为整个行业将走向数据密态时代，今天AI加速了这一趋势。这些年蚂蚁计算也申请了1000多件隐私计算相关的专利，专利数量全球第一。此外，蚂蚁还和和各个CPU厂商合作，提出了统一的开源开放的一致化的强安全通用的星绽机密计算接口。“我们是基于国家认证的、公信的第三方信任根，提供强大安全保障，能够很有效地支持各种各样的应用，能够有效降低整体的密算相关使用成本。”

今年5月底，蚂蚁集团对外公布了以人工智能和数据要素技术为核心的科技战略，随后成立了独立运营的密态计算公司——浙江蚂蚁密算科技有限公司，将提供密算相关的产品和服务。该公司蚂蚁集团副总裁、首席技术安全官韦韬担任董事长和法定代表人，蚂蚁集团隐私计算部隐语总经理王磊出任 CEO，由蚂蚁集团全资控股。

蚂蚁密算的商业化之路

在2024年世界人工智能大会上，蚂蚁集团发布“隐语Cloud”大模型密算平台，通过软硬件结合的可信隐私计算技术，在大模型托管和大模型推理等环节实现数据密态流转，保护模型资产、数据安全和用户隐私。

蚂蚁密算CEO王磊介绍，“隐语Cloud”大模型密算平台首批推出两大服务，分别为大模型密态托管和大模型密态推理。大模型密态托管，指模型提供方可以将模型加密后托管在平台上，一键完成云上密态部署，保护模型资产不被泄漏和盗用；大模型密态推理，是指数据以密态形式完成推理，保护用户交互时的数据安全、商业机密等。

据介绍，隐语Cloud”大模型密算平台提供公有云和专有云交付方案，支持市面上主流的通用大模型。以公有云为例，模型提供者可以一键加密上传自己的大模型，10分钟即可完成高可用推理服务的发布。用户通过网页就可以实现对模型的加密访问，无需感知到复杂的加密过程，即开即得。

现在，以隐私计算技术为代表的数据要素技术，正在加速落地在农村金融、公共服务、新能源产业等领域。

比如，在农村普惠金融上，农业农村部大数据发展中心与网商银行、蚂蚁集团联合发起的“农户秒贷”服务，发挥双方在技术、数据方面的优势，基于隐语与星绽可信隐私计算技术栈，联合搭建金融风控模型，结合网商银行大山雀风控系统，发起农户秒贷服务。截至2024年5月初，超过600万种植户获得贷款额度，其中78.3%农户种植面积不到10亩，是以往金融服务难以覆盖的人群。

在新能源车险上，为破解新能源车险定价难题，人保财险、平安产险、太平洋产险等多家保险公司与互联网保险代理平台“蚂蚁保”合作，共同研发上线了车险“联合定价”技术。该技术以蚂蚁集团可信隐私计算技术框架「隐语」为基础，从“车”和“人”两个维度实现更精准的车险定价，在提升保险公司运营效率的同时，也让有好驾驶习惯的车主投保更便宜。这一技术去年已率先应用于新能源车型，目前正逐步覆盖燃油车型。“联合定价”后的车险报价，平均可为车主节省数百元。

韦韬表示：“我们希望联合产业合作伙伴，把蚂蚁集团多年来在密态计算技术上的探索和创新，以开源和产品化的形式对外开放，助力推动产业向前发展，为实体经济和中小微企业创造新的价值，让数据价值的流动像自来水一样即开即用。”

产学研届积极推进一系列的技术标准制定

在隐私计算技术规模化落地产业上，还存在诸多挑战。比如，平衡“数据流通”和“个人信息保护”的双重目标，《网络安全法》《个人信息保护法》特别设置了“个人信息匿名化条款”，将匿名化后的个人数据排除在个人信息保护之外。然而，由于匿名化条款的法律内涵和实施标准有待厘清，匿名化条款往往存而不用。

推动数据要素可信流通体系，构建全新的技术标准的体系也至关重要。在2024世界人工智能大会上，围绕隐私计算产品通用安全分级和个人信息匿名化制度，国内多家产学研机构联合也发布了两份白皮书，聚焦解决不同隐私计算技术产品的通用安全分级，以及受控环境下的数据匿名化等问题。

《个人信息匿名化制度：技术与法律（2024）》白皮书由对外经济贸易大学、大数据技术标准推进委员会和蚂蚁集团共同发布。白皮书建议，在数据基础设施的规划与建设过程中，应充分考虑个人信息匿名化相关处理技术与制度规范内容。为破解“个人信息匿名化”的困境，必须从单一的法律视角转向复合的“数据基础设施”的路径。匿名化条款可以拓展为一套融合法律和技术的基础设施，从而推动在不同行业、不同机构之间实现可信、安全的数据共享、开放、交易。

针对隐私计算技术路线众多，在产业落地应用中出现“讲不清”、“看不懂”、“不敢用”的情况，《隐私计算产品通用安全分级》白皮书给出通用安全分级的设计思路，包括按照攻防效果分级来屏蔽不同技术路线差异，在“可证安全”和“不安全”之间增加一个“抵御已知攻击”的分级水位，引入软件信誉度等更多维度量化“实现安全”，明确所有技术特征与安全分级的对应关系，推动隐私计算技术实现大规模落地。

文/北京青年报记者温婧
编辑/田野