北京青年报

自主创新：走中国特色的大模型发展之路

北京青年报客户端 2023-09-15 07:20

日前召开的2023年中国国际服务贸易交易会上，涉及智慧医疗、科技创新评价、金融、教育等领域的人工智能大模型批量“上岗”。在会上，北京市人工智能大模型高质量数据集（第二批）发布16家单位41个数据集，涉及医学、生物、农业、金融、智慧城市、自动驾驶、科技服务、市场营销等多个领域，数据总量规模约112TB（数据储存单位），将为通用大模型和行业大模型训练及应用落地提供坚实的“资源”保障。

大模型（Large Model）是指具有数百万或数十亿个参数的深度神经网络模型，经过专门训练过程后能对大规模数据进行复杂的计算处理和任务处理。得益于拥有庞大的数据、参数以及较好的学习能力，大模型增强了人工智能的通用性，生成式人工智能本领加速进化，更高效、更“聪明”的大模型将渗透到越来越多领域，成为人们生产生活的基础性工具，推动经济社会发展和产业的深刻变革。

据报道，目前国内有百度、字节、华为、腾讯、科大讯飞等11家大模型通过《生成式人工智能服务管理暂行办法》备案，首批8月31日起陆续向社会公众开放服务。最新的动态是，近日召开的2023腾讯全球数字生态大会上，腾讯混元大模型正式亮相，通过腾讯云对外开放。该大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，具备强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力，腾讯会议、微信搜一搜等50多个腾讯业务和产品已接入该大模型测试，并取得初步效果。

对于通用人工智能来说，“聊天”显然不是终点，大模型长期的价值将通过在行业中的应用来实现，因此应用场景和生态共建是决胜关键。专家认为，我国支持平台经济向智能经济转型，在生活、教育、医疗、公共服务等领域找到最适合的赛道，打出具有特色和优势的“阵法”，做到“来自应用场景，用于行业场景”。为此，链主企业可通过开放先进模型和数据，带动上下游生态获得更好发展，同时反哺链主企业开拓业务领域，实现共建共赢生态发展目标。

科技部新一代人工智能发展研究中心最新研究报告显示，我国研发的大模型数量位居全球第二。这体现了我国在人工智能领域的创新实力和发展潜力，同时也提示我们，必须走具有中国特色的大模型发展之路——在大模型已成为智能时代“入口”和国际竞争关键领域的当下，通用大模型必须坚持自主研发和创新，而非主要基于国外开源模型的改良或适配。以自主可控为优先发展条件，通过全链路自主研发创新，逐渐形成体系化的产业链、人才链、技术链和创新链，才能抢占国际人工智能技术发展先机和高地，走出一条大模型高质量发展的“中国路径”。

人工智能大模型带来的治理挑战也不容忽视。据介绍，人工智能大模型具有“学习世界知识”功能（“世界知识”主要存在于互联网上的公开网页内容和书籍，知识体量大，专业程度高，知识密度高），对个人身份信息（姓名、年龄、身份证号等）不感“兴趣”，大模型厂商还会主动对个人信息进行“清洗”，避免被大模型被动学习。营造良好的大模型创新生态，需要做好前瞻研究，建立健全相关法律法规、制度体系和伦理规范，大力兴利除弊，不断推出更丰富便捷的应用产品，助力中国经济持续健康高质量发展。

文/袁京力

图源/视觉中国

编辑/姬源