北京青年报
国产大模型Kimi能否“登月”
经济日报 2024-03-24 10:30

近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描绘他的通用人工智能(AGI)梦想。Kimi能否如愿“登月”?

一看目标是否远大。

通用人工智能,指具备与人类同等智能或超越人类的人工智能。短短几年前,大部分人还认为通用人工智能是一个遥不可及的目标。一年多前,美国公司OpenAI的ChatGPT产品引爆人工智能大模型热潮,让不少人觉得通用人工智能实现在望,大模型赛道出现百舸争流盛况。截至2023年年底,我国累计发布了200多个人工智能大模型。大模型的巨大投入和高风险,让一些业内人士持观望批评态度。甚至有人认为国内大模型与美国差距太大,跟不上,白烧钱,不如采取底层技术搭美国便车、用开源大模型做应用层创新的跟进策略。

盲目烧钱一哄而上,诚然不可取。然而树无根不长,人无志不立。如果将实现通用人工智能比作登月工程,ChatGPT并未登上月球,而是跟其他大模型一样处于火箭原型测试阶段。大模型爆火一年多来,中美之间的实际差距在缩小,我们完全没必要轻言放弃。瞄准人工智能领域的第一性原理,通用人工智能就是核心,第一个拿到AGI门票的公司可以从那一刻起降维打击,实现赢家通吃。月之暗面公司以初生牛犊不怕虎的精神志指“登月”,堪称目标远大,值得期许。

二看特长是否突出。

人工智能也需要差异化竞争。月之暗面公司精准把握用户需求和应用场景,打造出具有记忆点的产品Kimi智能助手,引领了人工智能的“长文本”时代。OpenAI官方去年11月发布的GPT-4 Turbo支持128k上下文,大约相当于10万汉字。而Kimi智能助手在去年10月首次亮相时,就可支持20万汉字的无损上下文长度,是大模型产品里这一单项能力的冠军。仅仅5个月后,月之暗面公司就宣布把Kimi的这一能力提升到了全新的数量级200万汉字。

升级后,过去人类要10000小时才能成为专家的领域,现在交给Kimi智能助手,只需要10分钟。有一个演示鲜明地展现了Kimi高超的“吃瓜”智能。使用者将《甄嬛传》剧本传给Kimi,再问它哪些细节表明甄嬛的孩子是果郡王的?Kimi能在不同时间段、各个场景的故事情节中,深入挖掘出相关线索并一一列出,堪比一个看了几十遍电视剧的“甄”学家。

文本长度受限带来的“碎片化”输入,常常降低人工智能的“智能”。一篇英语长文如果让大模型来翻译,受限于输入长度要分割成几块,就可能出现前后不一致,比如“chair”在第一段输入时被译成“主席”,在第二段输入时被译作“椅子”。Kimi的长文本输入就解决了这个问题,比起“聊天机器人”,更像一个“智能助手”。Kimi远超同侪的长文本能力解锁了更多可能,包括完整代码库的分析理解、可以自主帮人类完成多步骤复杂任务的智能体、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。这也让“长文本”有望成为“登月”的第一步。

当然,目标远大、特长突出,只是“登月”的必要条件,而不是充分条件。展望未来,最成功的AGI公司必将超越现在的所有人工智能公司。它不一定是OpenAI,也不一定是月之暗面,但中国公司需要“登月”这样目标远大的理想,国产大模型也需要“登月”这样富有竞争力的技术储备。

文/佘惠敏

图源/视觉中国

编辑/姬源

相关阅读
9.11比9.8大?大模型们为何会在小学数学题上集体翻车
澎湃新闻 2024-07-17
经济日报:以用促建做强大模型产业
经济日报 2024-07-06
OpenAI“断供”,国产大模型“抢客”
澎湃新闻 2024-06-26
大模型参加K12学科测验:文强理弱,对图表理解能力不足
澎湃新闻 2024-05-20
大模型“越狱” 如何监管开发者 国外大语言模型曾教人如何抢银行、制造炸弹
广州日报 2024-04-29
传月之暗面创始人杨植麟已“套现”数千万美元
澎湃新闻 2024-04-24
联影智能发布了一款医疗大模型
澎湃新闻 2024-04-13
Kimi概念股火爆出圈 私募人士把脉AI行情持续性
中国证券报 2024-03-28
最新评论