北京青年报

千行百业加速拥抱大模型

人民日报海外版 2023-12-23 09:33

近日，《联合国气候变化框架公约》第二十八次缔约方大会（COP28）在阿联酋迪拜举行。大会期间，中国研究团队展示的人工智能气候大模型引发广泛关注。此款名为“伏羲”的大模型，对气象进行预报的时间范围长、精度高。

当前，中国国产大模型进入高速发展期，千行百业加速拥抱大模型。科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示，中国研发的大模型数量排名全球第二，涌现出一批具有行业影响力的预训练大模型。

工业和信息化部新闻发言人陶青表示：“以大模型为代表的人工智能发展呈现出技术创新快、应用渗透强、国际竞争激烈等特点，深刻改变制造业生产模式和经济形态，展现出强大的赋能效应。”

垂直大模型密集“上新”

专家认为，大模型的长期价值将通过行业应用实现。随着技术不断迭代更新，大模型的应用场景日益广泛。

在北京经济技术开发区（北京亦庄），不少驾车的市民发现，遇到红灯的次数明显变少了，经常是“一路绿灯”。这背后，是全域信控与交通大模型在发挥作用。

据了解，北京亦庄联手百度，将路侧感知数据、互联网数据等多源时空数据进行融合。在此基础上，利用交通大模型研判拥堵发生的可能性，叠加仿真推演，生成全域信控方案，并自动优化信号灯配时方案，由“车看灯行”变为“灯随车动”。据测算，北京亦庄布局全域信控后，路口的平均通过时间缩短28%。

从交通到文旅，从教育到医疗，近期，垂直领域的各类大模型密集“上新”。相较于通用大模型，垂直大模型具有更强的专业性，能够更好地解决特定领域的问题和提供更加精准的服务。

携程集团发布的旅游行业垂直大模型“携程问道”，支持自然语言交互，可以辅助用户进行酒店、景点预定以及行程规划决策等。

科大讯飞发布的“讯飞晓医”APP，基于讯飞星火医疗大模型，可实现健康自查、体检报告解读、健康档案管理等功能，为用户提供健康咨询。

南京农业大学科研团队发布的古籍大语言模型，能够实现词法分析、信息抽取、智能作诗等功能，有望应用推广到古籍整理、数字文娱等领域。

数据显示，截至今年10月，中国拥有10亿参数规模以上大模型的厂商及高校院所超过250家，垂直行业应用成为大模型产业落地的关键赛道。上海财经大学校长刘元春认为，中国作为世界第二大经济体，拥有超大规模市场和数字资源优势，为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。

“当前，大模型‘基础设施—底层技术—基础通用—垂直应用’的发展路线逐渐清晰。”中国工程院院士、湘江实验室主任陈晓红表示，大模型技术与实体经济加速融合，应用场景十分广泛。

数据“燃料”加快共建共享

数据是大模型训练的“燃料”，数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求，推动中文语料数据资源加快共建共享。

今年7月，2023世界人工智能大会发起成立了中国大模型语料数据联盟。8月，上海人工智能实验室宣布，联合中国大模型语料数据联盟成员单位共同开源发布“书生·万卷”1.0多模态预训练语料。本次开源的数据总量超过2TB，包含超5亿个文本、2200万个图文交错文档、1000个影像视频。

在11月举行的2023人工智能计算大会上，智源研究院联合阿里云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。

数据交易日益兴起，为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施（2023—2025年）》提出：“依托上海数据交易所建立语料数据交易板块。”当前，上海数据交易所挂牌的语料数据产品包含文本、音频、图像等多模态，覆盖金融、交通、医疗等领域。上海数据交易所总经理汤奇峰表示：“语料库采购已经在不少大模型企业成本中占据重要比重，上海数交所希望以市场配置的方式组织数据要素、推动语料库建设。”

建设智算中心增加算力供给

大模型进行训练和推理时，对算力的需求量巨大。算力是大模型的底座。算力通常分为通用算力、智能算力和超算算力，大模型需要的是智能算力。如何破解智能算力紧缺问题，成为大模型发展路上的必答题。

电信运营商、互联网企业等积极投入智算中心建设之中。去年至今，重庆移动智算中心、阿里云张北超级智算中心等陆续投入运营。今年以来，中国联通长三角（芜湖）智算中心、河北石家庄智算中心等相继启动建设。

当前，各地加速推动算力基础设施建设，提升算力供给能力。《北京市促进通用人工智能创新发展的若干措施》提出，加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心，形成规模化先进算力供给能力，支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。《河南省重大新型基础设施建设提速行动方案（2023—2025年）》提出，实施高性能算力提升工程，加快建设郑州、洛阳等全栈国产化智能计算中心，构建中原智能算力网。

在“东数西算”战略背景下，西部智算中心建设迎来发展机遇期。11月30日，青藏高原第一座智算中心——青海昆仑人工智能算力中心正式揭牌，依托三江源国家大数据基地，实现算力资源的托管运营。12月7日，宁夏回族自治区首个大规模集群智算中心建设项目签约，该中心以国产全功能GPU为底座，为大模型训练与推理、3D图形渲染等提供算力支撑。

今年10月，工业和信息化部等6部门印发《算力基础设施高质量发展行动计划》，提出到2025年，算力规模超过300EFLOPS（EFLOPS是指每秒百亿亿次浮点运算次数），智能算力占比达到35%。京津冀、长三角、粤港澳大湾区、成渝等节点面向重大区域发展战略实施需要，有序建设算力设施；贵州、内蒙古、甘肃、宁夏等节点推进数据中心集群建设的同时，着力提升算力设施利用效率，促进东西部高效互补和协同联动。

“算力尤其是智能算力已经成为驱动大模型进化的核心引擎。智算力就是创新力，已经成为产业共识。”浪潮信息董事长彭震表示，应大力发展普适普惠的智算中心，使智能算力成为城市的公共基础资源，用户可以选择自建算力集群，也可以采用智算中心提供的算力服务来完成大模型开发。

编辑/范辉