北京青年报

多款大模型向公众开放实测“智商”和“情商”

第一财经 2023-09-06 14:02

9月5日，科大讯飞宣布讯飞星火认知大模型面向全民开放。讯飞星火大模型也成为继百度文心一言和商汤“商量”（SenseChat）之后，又一向公众开放的主流聊天机器人应用。同日，360智脑大模型也宣布向公众开放。

“我们要打造每个人的人工智能助手，让每个人都真正能够享受到人工智能的红利，真正解决社会刚需。”科大讯飞董事长刘庆峰表示。

不过，资本市场对于此次开放的大模型反应相对冷淡，9月5日，科大讯飞和三六零股价分别下跌1.8%和1.2%；商汤科技股价大跌4.8%，百度股价下跌1.5%。

随着人工智能技术日益成为企业竞争的焦点，企业正在疯狂投入资源、竞相开发人工智能相关的大模型产品。

百度CEO李彦宏周二表示，中国已经发布了70多个参数超过10亿规模的大型语言模型。百度向公众开放了AI聊天机器人之后，用户已超过600万。

上周，首批根据《生成式人工智能服务管理暂行办法》完成备案的五家大模型宣布向全社会开放服务，包括文心一言、百川智能、抖音云雀大模型、质谱清言、商汤商量SenseChat。

对于竞争激烈的互联网行业而言，率先获得批准并向公众开放的公司具有先发优势，这意味着它们能够比竞争对手更快地调整产品。

李彦宏就表示，通过广泛使用文心一言，百度将“收集大量有价值的现实世界人类反馈”，以进一步改进聊天机器人。

这或许也意味着这些企业距离变现更近一步。在OpenAI的聊天机器人产品ChatGPT发布以来，分析机构预计，未来12个月内有望为OpenAI创造超过10亿美元的收入。

不过，与ChatGPT相比，目前基于国内大模型开发的AI聊天机器人的“智商”和“情商”还需要更多的训练。但相比之下，国内几款已向公众开放的大模型的“情商”似乎要高于“智商”。

第一财经记者随机选择了一道奥数题，分别向百度的文心一言和商汤的SenseChat提问，但都未达到标准答案。

这是一道小学奥数题，问题是：烧水沏茶，洗水壶用1分钟，烧开水用10分钟，洗茶壶用2分钟，洗茶杯用2分钟，取茶叶用1分钟，如何安排能尽快喝上茶？

以下是文心一言的答案。它回答道：“这是一个时间规划的问题，我们需要计算完成所有任务所需的总时间。1 + 10 + min(2,2,1) = 12 分钟。所以，最少需要12分钟来完成所有任务。”

讯飞星火的回答是：“为了尽快喝上茶，我们可以按照以下顺序进行操作：洗水壶(1分钟)，烧开水(10分钟)，在烧开水的同时，洗茶壶(2分钟)，继续在烧开水的同时，洗茶杯(2分钟)，继续在烧开水的同时，取茶叶(1分钟)。等待水开(剩余5分钟)，沏茶。所以总共需要15分钟。”

根据奥数的标准答案：洗水壶一分钟，在烧开水的10分钟内，我们已经完成了洗茶壶、洗茶杯和取茶叶的操作。所以，只需要等待水开后，就可以尽快喝上茶了。正确答案是11分钟！

如果再问一道关于生活建议的题目：为了钱发生争执时，你会怎么办？文心一言和讯飞星火大模型的回答类似。它们都认为，如果为了钱吵架，首先应该冷静下来，好好地分析一下问题的本质，思考是因为什么而吵架；然后，尝试找到解决问题的方法；也可以考虑制定一个明确的财务计划，帮助双方更好地理解和管理金钱问题。

讯飞星火的答案

文心一言的答案

文心一言特别还提到，“如果问题依然存在，可以考虑寻求专业的婚姻咨询师的帮助，他们可以提供专业的建议和指导。”

未来将会看到更多的人工智能大模型向公众开放。不过，业内人士认为，“百模大战”的格局可能不会持续。“很多人都在涌入大模型开发的赛道，但随着向公众开放审批制度的形成，行业可能很快会触发整合。”一位人工智能分析师告诉第一财经记者，“未来只有那些拥有数据和技术能力的企业，才最有可能推动行业前进。”

编辑/范辉