2022年底,诸如ChatGPT、Midjourney、Stable Diffusion等大型模型的相继亮相,掀起了人工智能大模型的发展热潮。国内企业如百度、商汤、360、云知声、科大讯飞等也纷纷发布了各自的成果,推动了人工智能技术在各行各业的落地应用。
AI大模型展露巨大潜力
AI大模型在语言理解、图像识别、自然语言处理等领域展现出巨大的潜力和迅猛的发展趋势。它能够帮助企业和机构加快创新步伐,提高效率,降低成本。例如,在自然语言处理领域,大模型可以用于机器翻译、文本摘要、智能客服等应用场景;在图像识别领域,大模型可以提供更准确的图像识别和分析能力。
速途网与大模型之家联合发布的一份报告显示,根据预测,到2023年全球人工智能大模型市场规模将达到210亿美元,并在2028年达到1095亿美元。中国作为全球人工智能大模型市场的重要参与者,预计到2023年中国大模型产业市场规模将达到147亿元人民币,并在2028年达到1179亿元人民币。
“小说生成电影”成为可能
人工智能大模型的发展,会带来哪些改变呢?其一,将引发人工智能算力的革命。大模型参数量的增加导致训练过程的计算需求呈现指数级增长。为了快速训练大规模模型,需要强大的计算能力来支持高效的分布式训练和并行计算。随着硬件设备的进步,如高性能计算机和分布式计算平台的普及,将成为支持更大规模的模型训练和迭代的重要方式。
其二,将引发人工智能多模态、多场景的革命。随着传感器技术的发展和物联网的兴起,大量的多模态数据,如图像、视频、声音等被广泛采集和应用。大模型可以利用这些多模态数据进行跨模态学习,从而提升其在多个感知任务上的性能和表现。这意味着,一本小说生成一部电影,或者一部电影转化成一部小说都将成为可能。
并且,大模型具有强大的泛化能力,可以在不同模态和场景之间实现知识的迁移和共享,将其应用扩展到不同的领域和场景。
其三,通过结合多模态数据和智能算法,大模型能够赋能多个行业,为行业提质增效提供助力,推动数据与实体的融合,改变行业发展格局。
例如,在法律领域,大模型可以作为智能合同生成器,根据用户的需求和规范,自动生成合法和合理的合同文本;在娱乐领域,大模型可以作为智能剧本编剧,根据用户的喜好和风格,自动生成有趣和吸引人的剧本故事;在工业领域,大模型可以作为智能质量控制器,根据生产数据和标准,自动检测和纠正产品质量问题;在教育领域,大模型可以作为智能学习平台,根据知识图谱和学习路径,自动推荐和组织学习资源。
最后,大模型将引发用户习惯的革命。统计数据显示,目前已有很高比例的人群了解大模型,并且有相当比例的人群已经使用过。特别是在一线城市,人们对大模型的了解和使用的欲望更加普遍和强烈。
“具身AI”是新技术方向
“具身Al”或成为大模型发展的新技术方向。值得关注的是,具身Al与人形机器人并不是一码事。具身智能最大的特质就是能够以主人公的视角去自主感知物理世界,用拟人化的思维路径去学习,从而做出人类期待的行为反馈,而不是被动地等待数据投喂。这一技术方向的发展将进一步提升大模型的智能水平,拓展其应用场景,以及深化与人类的互动。
以自然语言交互的大模型为例,它们不仅具有对话的能力,还能够感知和理解环境中的物体和事件,以及根据人类的意图和需求做出合适的反应。通过人机对话,大模型可以给机器人发命令、理解机器人的反馈、分解任务变成动作、帮助机器人处理图像、声音等多模态的数据,指导机器人改正错误、提高机器人的学习能力等。
文/北京青年报记者 陈斯
编辑/王静