历经数月的热议和期待,国产大模型于近日进入密集发布期。
4月11日,阿里云峰会在京召开,首次对外公开展示了其自研大语言模型“通义千问”。前一天(10日),商汤(HK00020,股价3.00港元,市值1104亿港元)和昆仑万维(SZ300418,股价48.03元,市值571亿元)接连宣布了旗下大模型,分别为“日日新SenseNova”大模型体系和“天工”3.5。4月9日,三六零(SH601360,股价16.36元,市值1169亿元)的“360智脑”落地搜索场景,面向企业用户开放内测。
随着国产大模型竞争加速,政府部门开始重视对于AIGC的监管。4月11日,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见,国家对AIGC的监管治理已经提上日程。
在此背景下,竞争与风险已成为AI领域新的热门主题。AI赛道熙熙攘攘,企业如何脱颖而出?
当大模型不再稀缺
ChatGPT火速出圈后,国内大模型也“赛事”吃紧。短短2个月内,已有数个国产大模型登台亮相。
3月16日,百度率先发布大语言模型“文心一言”。在发布会现场,李彦宏对发布时间进行了解释:是需求推动了文心一言的面世——百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。
而其余厂商的步子也紧紧跟上。尤其在近日,国产大模型呈现密集发布的态势。
4月9日,三六零官方正式宣布,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。
4月10日,商汤科技发布“日日新SenseNova”大模型体系,覆盖自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。同日,昆仑万维宣布,与奇点智源合作自研的国产大语言模型“天工”3.5发布在即,并将于4月17日启动邀请测试。
4月11日,阿里云峰会上,阿里巴巴大语言模型“通义千问”正式亮相。阿里巴巴集团董事会主席兼首席执行官、阿里云智能集团首席执行官张勇表示,未来阿里巴巴所有产品都将接入“通义千问”大模型,进行全面改造。
新一轮AI风口来临,掘金者步履不停。但入局门槛之高也引人注目。
模型越大,对算力的要求越高。在人工智能大模型技术高峰论坛上,浙江大学人工智能研究所所长吴飞表示,算力方面,ChatGPT的训练门槛是1万张英伟达V100芯片、约人民币10亿元,模型训练算力开销是每秒运算一千万亿次,需运行3640天。
计算机科学家、自然语言模型专家吴军在得到直播间谈及ChatGPT的训练成本时介绍:“大概可能是3000辆特斯拉的电动汽车,每辆跑到20万英里,把它跑死,这么大的耗电量,才够训练一次,这个非常花钱的一件事”。
图片来源:视频截图
“ChatGPT这样的东西,我很赞成百度的李彦宏讲的,全国有一两家搞就行了,”前述人工智能大模型技术高峰论坛上,中国工程院院士潘云鹤表示,“我们要瞄准的是它没有到的那些地方。”
竞争主题迅速转换
当大模型不再稀缺,应用层的机会展开,什么样的公司更能脱颖而出?
关于赛道竞争,4月8日,京东集团副总裁何晓冬在接受《每日经济新闻》记者采访时强调,“每个人还是想清楚自己的壁垒在什么地方。”
以AI虚拟人这样的应用为例,“数字人可能大家看得很多,但真正用的时候,细节还是很关键的。”何晓冬表示,嘴型是否有错位、姿态是否丰富,包括上线以后的各方面成本,“这是一个技术壁垒,如果是技术公司的话,你就往这方面做。”
何晓冬接着说道,如果是虚拟人的运营公司,比如通过用数字人去做大量运营、积累了大量的客户和用户,最后重构一个数字人Facebook,上面有1亿的真实用户跟你的数字人互动,“这时候你可能就不是很在乎是谁提供的数字人技术了,你这1亿用户和交互场景变成了你的壁垒。”
另一方面,一路“狂飙”的ChatGPT也引发多个国家对安全风险的重视。意大利率先宣布禁止使用聊天机器人ChatGPT,随后,不少国家开始考虑对ChatGPT采取更严格的监管措施。
4月11日,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》(以下简称《征求意见稿》)公开征求意见。其中提出,利用生成式人工智能产品向公众提供服务前,应依规向国家网信部门申报安全评估,并履行算法备案和变更、注销备案手续。
图片来源:网页截图
对此,奇安信(SH688561,股价78.19元,市值536亿元)方面向《每日经济新闻》记者做出解读。奇安信集团副总裁张卓认为,前述《征求意见稿》有三点值得关注,首先是强调了安全评估和算法备案的前提性和必要性;其次是强调提供者需确保数据安全和个人信息保护合规,尤其是隐私保护;最后是夯实了违规责任的处罚措施,包含追究刑事责任。
张卓表示,前述《征求意见稿》的发布以及全球范围内对于AIGC的监管力度加强,意味着数据安全和隐私保护已经成为AIGC发展的前提和关键。
编辑/樊宏伟