北京青年报

国产大模型Kimi能否“登月”

经济日报 2024-03-24 10:30

近日，能一气吞下200万字的国产大模型Kimi爆火，引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面（Moonshot AI）研发，公司创始人杨植麟多次用“登月”来描绘他的通用人工智能（AGI）梦想。Kimi能否如愿“登月”？

一看目标是否远大。

通用人工智能，指具备与人类同等智能或超越人类的人工智能。短短几年前，大部分人还认为通用人工智能是一个遥不可及的目标。一年多前，美国公司OpenAI的ChatGPT产品引爆人工智能大模型热潮，让不少人觉得通用人工智能实现在望，大模型赛道出现百舸争流盛况。截至2023年年底，我国累计发布了200多个人工智能大模型。大模型的巨大投入和高风险，让一些业内人士持观望批评态度。甚至有人认为国内大模型与美国差距太大，跟不上，白烧钱，不如采取底层技术搭美国便车、用开源大模型做应用层创新的跟进策略。

盲目烧钱一哄而上，诚然不可取。然而树无根不长，人无志不立。如果将实现通用人工智能比作登月工程，ChatGPT并未登上月球，而是跟其他大模型一样处于火箭原型测试阶段。大模型爆火一年多来，中美之间的实际差距在缩小，我们完全没必要轻言放弃。瞄准人工智能领域的第一性原理，通用人工智能就是核心，第一个拿到AGI门票的公司可以从那一刻起降维打击，实现赢家通吃。月之暗面公司以初生牛犊不怕虎的精神志指“登月”，堪称目标远大，值得期许。

二看特长是否突出。

人工智能也需要差异化竞争。月之暗面公司精准把握用户需求和应用场景，打造出具有记忆点的产品Kimi智能助手，引领了人工智能的“长文本”时代。OpenAI官方去年11月发布的GPT-4 Turbo支持128k上下文，大约相当于10万汉字。而Kimi智能助手在去年10月首次亮相时，就可支持20万汉字的无损上下文长度，是大模型产品里这一单项能力的冠军。仅仅5个月后，月之暗面公司就宣布把Kimi的这一能力提升到了全新的数量级200万汉字。

升级后，过去人类要10000小时才能成为专家的领域，现在交给Kimi智能助手，只需要10分钟。有一个演示鲜明地展现了Kimi高超的“吃瓜”智能。使用者将《甄嬛传》剧本传给Kimi，再问它哪些细节表明甄嬛的孩子是果郡王的？Kimi能在不同时间段、各个场景的故事情节中，深入挖掘出相关线索并一一列出，堪比一个看了几十遍电视剧的“甄”学家。

文本长度受限带来的“碎片化”输入，常常降低人工智能的“智能”。一篇英语长文如果让大模型来翻译，受限于输入长度要分割成几块，就可能出现前后不一致，比如“chair”在第一段输入时被译成“主席”，在第二段输入时被译作“椅子”。Kimi的长文本输入就解决了这个问题，比起“聊天机器人”，更像一个“智能助手”。Kimi远超同侪的长文本能力解锁了更多可能，包括完整代码库的分析理解、可以自主帮人类完成多步骤复杂任务的智能体、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等。这也让“长文本”有望成为“登月”的第一步。

当然，目标远大、特长突出，只是“登月”的必要条件，而不是充分条件。展望未来，最成功的AGI公司必将超越现在的所有人工智能公司。它不一定是OpenAI，也不一定是月之暗面，但中国公司需要“登月”这样目标远大的理想，国产大模型也需要“登月”这样富有竞争力的技术储备。

文/佘惠敏

图源/视觉中国

编辑/姬源