“文心一言累计用户规模已达3亿,日调用次数也达到了5亿。”6月28日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在WAVE SUMMIT深度学习开发者大会2024上宣布,并正式发布文心大模型4.0 Turbo、飞桨框架3.0等最新技术,披露飞桨文心生态最新成果。
王海峰发布了文心大模型4.0 Turbo,网页版、APP、API陆续面向用户开放。据了解,企业用户即刻起登录百度智能云千帆大模型平台即可使用API服务。
他介绍,文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。王海峰发布了飞桨新一代框架——飞桨框架3.0,具备动静统一自动并行、编译器自动优化、大模型多硬件适配、大模型训推一体等核心技术,支撑大模型效果更好,性能更优。截至目前,飞桨文心生态已凝聚1465万开发者,服务37万家企事业单位,创建95万个模型。
在技术的通用性方面,大模型在解决不同任务、语言、模态、场景的通用性都变得越来越好。以自然语言处理为例,之前有分词、句法分析、语义匹配、机器翻译、问答、对话等等很多子方向,现在一个大语言模型就可以解决绝大多数任务;语言方面,大模型既可以解决单语言的问题,也可以跨语言,不仅学习了人类的自然语言,也学习了人工定义的形式语言,架起了从思考到执行的桥梁;同时,大模型也可以实现多模态的统一建模,广泛赋能各行各业应用等。总体上,人工智能技术的通用性越来越强。
在能力的全面性方面,理解、生成、逻辑、记忆是人工智能的四项基础能力,其他各项人工智能的典型能力,无论是创作、解题、代码,还是规划、决策等,基本上都是这四项基础能力的综合运用。以基于文心大模型实现的运营活动系统为例,模型首先理解用户需求,进行系统设计,然后规划相关的任务来执行,接下来根据规划生成代码,逐步实现系统搭建、包括数据库、后端功能、前端页面,等等,再进行服务的部署,如果部署失败,模型能够根据报错信息自动反思迭代,直到部署成功,服务顺畅运行。大模型完成系统开发到服务运行的过程,充分体现了大模型的理解、生成、逻辑、记忆四项基础能力,以及对这四项能力的综合运用。这四项能力越强,越接近通用人工智能。
王海峰最后表示,人工智能基于深度学习及大模型工程平台,包括算法、数据、模型、工具等,也已经具备了非常强的通用性,并具备了标准化、模块化和自动化的特征,推动人工智能进入到了工业大生产阶段,通用人工智能将加速到来。
文/北京青年报记者 温婧
编辑/田野