谷歌2月21日发布了新的人工智能“开放模型”Gemma,将大模型开源意味着外部开发者可以将其打造为自己的模型。谷歌也成为继Meta之后,又一家试图走开源大模型路径的主要科技公司,并加速全民AI时代的到来。
谷歌表示,Gemma是一系列“轻量级”先进的开放式模型,采用与创建Gemini模型相同的研究和技术而构建。开发者可以使用Gemma“开放模型”系列免费构建人工智能软件。该公司表示,正在公开关键的技术数据,例如所谓的“模型权重”。
谷歌CEO皮查伊(Sundar Pichai)表示:“Gemma展示了强大的性能,今天开始将在全球范围提供,可在笔记本电脑或者谷歌云上运行。”
市场分析认为,谷歌将大模型开源可能会吸引软件工程师在谷歌的技术基础上进行开发,并鼓励使用其新盈利的云部门。谷歌表示,这些模型还针对谷歌云进行了优化。
不过Gemma也并不是完全“开源”,这意味着该公司仍可制定使用该模型的条款及所有权条款。
据介绍,相较于谷歌此前发布的Gemini模型,Gemma模型的参数可能更小,有20亿个或70亿个参数版本可供选择。谷歌尚未透露其最大的Gemini的参数尺寸。
谷歌表示:“Gemini是我们当今广泛使用的最大、功能最强大的AI模型。Gemma模型与Gemini共享技术和基础设施组件,Gemma模型能够直接在开发人员笔记本电脑或台式计算机上运行。”
该公司还强调,Gemma在关键基准上超越了参数更大的模型,同时遵守安全和负责任输出的严格标准。
此前开源的Meta的Llama 2模型参数最多可达700亿个。相比之下,OpenAI的GPT-3模型拥有1750亿个参数。
在谷歌发布的一份技术报告中,该公司将Gemma 70亿参数模型与Llama 2 70亿参数、Llama 2 130亿参数以及Mistral 70亿参数几个模型进行不同维度的比较,在问答、推理、数学/科学、代码等基准测试方面,Gemma的得分均胜出竞争对手。
英伟达在Gemma大模型发布时表示,已与谷歌合作,确保Gemma模型在其芯片上顺利运行。英伟达还称,很快将开发与Gemma配合使用的聊天机器人软件。
将较小参数的AI模型开放出来也是谷歌的商业策略。此前,科大讯飞也选择将较小的参数尺寸模型进行开源。
科大讯飞董事长刘庆峰向第一财经记者解释称:“通用大模型关键是看谁的性能好,而大模型开源是为了建立生态,因此从技术水平来看,一般开源大模型都会略低于通用大模型。”
“我们也观察到,好像很多企业会藏着自己最大的那个模型,可能还是希望能够建立起壁垒好做商业化。”一位从事AI大模型研发的研究人员对第一财经记者表示。
对于开源大模型目前也有不同的观点,一些专家认为,开源AI大模型可能会被滥用,而另一些专家则支持开源的方法,认为这可以推动技术发展,扩大受益人群。(钱童心)
编辑/田野