4月24日上午开盘,商汤科技股价大涨超过30%后紧急暂停交易,该公司预计将于当天下午发布公告。
4月23日,商汤科技举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并升级“日日新5.0”大模型体系。
商汤科技董事长兼CEO徐立在发布会上表示,日日新5.0大部分核心测试集指标上全面对标甚至已经超过OpenAI目前最先进的AI大模型GPT-4 Turbo。本次更新主要聚集增强了知识、数学、推理及代码能力。
徐立还称,今年是大模型在端侧应用爆发的元年。“去年我们主要聚焦在模型本身的参数发布,而今年则更多关注行业场景的落地,以行业来驱动人工智能的爆发。”
他说道,如果几十亿个端侧设备都在不停地调用大模型,将需要消耗巨大算力,而且没有任何一个服务器能够支撑得起,因此具有不同场景下端侧应用能力的“小模型”将是AI模型普及最关键的核心。
“在不同的适用场景下,小模型的决策速度可以更快。”徐立说道,“云端联动可以得到最佳推理效果。我们的数据显示,端侧在处理部分场景的占比超过70%时,推理的成本更低。”
事实上,大模型向“轻量化”方向发展已经成为业内的一个趋势。4月23日,微软也推出轻量级人工智能模型Phi-3-mini,希望通过提供具有成本效益的选项来吸引更广泛的客户群。
微软表示,Phi-3-mini是该公司发布的三种小语言模型(SLM)中的首个。SLM旨在执行更简单的任务,使资源有限的公司更容易使用。微软生成式AI研究副总裁Sébastien Bubeck表示:“Phi-3的价格与具有类似功能的其他模型版本相比,仅为十分之一。”
Phi-3-mini也在微软云服务平台Azure、机器学习模型平台Hugging Face以及英伟达的软件工具NIM上可用。
在商汤的发布会上,该公司还首次推出面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,降低企业应用大模型的门槛。
商汤在发布会上公布了这台大模型一体机的售价,每台售价35万元人民币起,单台机器可支持100人规模研发团队使用,使用成本最低为每人每天4.5元。该公司称,相比行业同类产品,使用该设备推理成本可节约80%。
编辑/范辉