北京青年报

不管“天空”多远，我们踏实赶路吧

北京日报客户端 2024-03-03 09:00

近段时间，OpenAI发布了其首个人工智能视频生成模型Sora。它以日语中的“天空”一词命名，寓意着“无限的创造潜力”。

相较于市面上其他竞品仅能生成不足10秒，且镜头视角单一、内容往往失真的视频，Sora的视频生成长度不仅突破到了一分钟，且能实现单视频的多角度镜头切换，最大限度还原现实世界的真实场景。

大幅跃进的视频生成能力，如同当年ChatGPT横空出世一般，再度向世人展示了人工智能所蕴含的惊人潜力。

对此，有中国互联网巨头承认旗下视频大模型“目前还无法作为完善的产品落地。”也有知名互联网企业家直言“中美人工智能差距在拉大。”

如何看待这种差距，如何缩小这种差距，如何面对新一轮全球科技竞争，值得我们思考。

（一）

对利用人工智能技术生成内容，大家并不陌生。

自ChatGPT出现后，AI编程、AI绘画、AI音乐等产品如雨后春笋般出现。虽然很多方面仍不完美，但凭借极高的生产效率，AIGC技术已经开始替代一些初级程序员、美工岗位，无比真切地向世人宣告“AI革命”正式来临。

但无论是聊天对答如流的ChatGPT，还是画画栩栩如生的Midjourney，本质上都只能依靠数学公式和文字规则输入和输出二维信息，没有真正与三维世界建立联系。而在现实中，即便是动物也可以依靠运动真实地和物理世界进行互动。因此，虽然大模型技术足够惊艳，但业界普遍认为其距离通用型人工智能仍有10年以上的差距。

但Sora不一样了！

从具体演示看，Sora已经拥有了叫做三维一致性的新能力。即其生成的视频，人物及场景元素可以随着视角的移动和旋转，在三维空间中仍然保持一致的运动状态。这意味着，大模型所存在的“涌现”现象，可以帮助其通过观察和学习来了解物理规律，构建逼真的三维物理世界，也就有了更进一步影响真实世界的能力。

从这个角度来说，Sora并不是简单的“视频制作工具”，而更像是某种“世界模拟器”，证明了大模型具有“打破次元壁”的能力。

有人断言，“一旦人工智能接上摄像头，把所有电影都看一遍，把所有短视频都看一遍，那么就真的距离通用型人工智能不远了，一两年就能实现。”

（二）

现象级产品，再度让人看到了人工智能技术所拥有的无限可能。而这样的突破，也搅动着国内舆论场。

综合看来，虽然我国目前的人工智能产品中，确实尚难有堪当Sora竞品者，但将此归结为难以逾越的“创新鸿沟”恐怕也有些夸大其词。

要知道，早在1710年，莱布尼茨就在《神正论》中提出建立一种普遍语言的设想，“这种语言是一种用来代替自然语言的人工语言，它通过字母和符号进行逻辑分析与综合，把一般逻辑推理的规则改变为演算规则，以便更精确更敏捷地进行推理”。“莱布尼茨之梦”被视为是现代人工智能的雏形。

1956年，达特茅斯会议正式召开，“人工智能（Artificial Intelligence）”一词获得与会者一致认可，相关学科由此正式启幕。然而，人工智能学科尽管群英荟萃，很多国家的科研机构也投入了大量金钱，也不断有重大研究成果问世，但受限于当时计算机技术的发展水平，人工智能的发展速度远远低于预期，直到2006年，第一个使用GPU来训练的深度卷积网络出现，人工智能的第三波浪潮才奔涌至今。

透过人工智能的曲折发展史可以看到，一项技术的发展既需要深厚的知识积累，也需要其他科技发展达到一定水平。

而在信息产业方面，中国无疑是后来者、追赶者，指望在人工智能前沿领域中，一出手就直达世界最先进水平，显然很不现实。

但中国作为成长中的创新型国家，一直在奋力奔跑、努力赶超。尤其是作为工具，人工智能终究是要拿来用的，而正如高铁、手机、新能源汽车等产业的“后发先至”一般，在超大市场规模、完整工业门类和庞大用户基数的支持下，中国的AI会遇到无比丰富的使用场景，进而快速修正问题。在自动驾驶、智能制造等方面，中国已经证明了这种优势。

因此面对“中美AI差距是否在拉大”的担忧，也有业内人士指出，中美在AI上的差距主要在于“确定技术方向”上，一旦方向确定，中国学习能力快的优势就能马上激发出来。

（三）

总体来看，Sora的出现，是人工智能大模型技术研究达到一定阶段的产物。

我们不必将单一产品过分“神化”，妄自菲薄嗟叹“为什么它没有诞生在中国”，但借鉴“大模型”技术的发展经验教训，能够为我国的自主创新之路提供助益。

就我国AI相关产业发展情况看，除了起步晚、人才少，重“盖房子”轻“打地基”的情况确实不同程度存在。许多创业者虽然有想法、有技术、有资金，但时间与效率焦虑过重，很容易在资本裹挟下变得短视。

比如，在机器视觉、语音识别等人工智能方向取得重大进展后，国内一些企业就开始追逐热点，将精力与金钱投入虚拟币、NFT、元宇宙等时髦概念，不再去深挖产品背后的技术逻辑，浪费了领先优势。

比如，在国外一些公司将产品开源后，就有人就将其“套壳”冒充自主研发，对芯片等掌握在别人手里的“硬科技”也不愿进行研发投入，看似创新成果不断，但本质上仍然是“造不如买、买不如租”的逻辑。

今天，新一轮科技革命和产业变革风起云涌，经贸科技领域政治化、工具化问题愈发严重，发达国家的创新步伐从未停歇，对别国的技术打压也愈发严苛，摆在追赶者面前的攻坚大环境并不友好。

在自己的地基上盖好房子，才不会有“倾覆之虞”。此时此刻，从“应用创新”大国，迈向“原始创新”强国，在众多技术路线的初始逻辑里刻入更多“中国人自己的东西”正变得十分紧迫。这容不得半点投机取巧、急功近利，必须心无旁骛、凝神静气。

（四）

“从0到1”从来不易，攻坚之难与现实差距客观存在，技术攻关、产品磨合、生态重构，每一个步骤都需要投入巨大的精力。

尤其是在人工智能技术空前发展的今天，科技创新生态在前所未有革新，科学的深奥程度也远超想象。做好技术攻坚不仅需要科研人员焚膏继晷、埋头苦干，更需要社会舆论保持定力、稳住心态。

在ChatGPT和Sora出现之后，有一种论调甚嚣尘上，即认为这个东西“不能帮助美国发展工业；不能让美国重返月球；不能让美国重新工业化”，所以Sora及ChatGPT都“没用”。

这无疑是狭隘偏误的。

从蒸汽机与纺织业结合引发工业革命，到美国军用通讯系统发展为全球互联网，再到让电子游戏画面更精美的GPU成为AI算力芯片的基础……历史一再证明，技术演进具有不可测性和爆发突然性，人类的科技发展不是科技树式的，而是开盲盒式的，我们并不知道一个看似不起眼的技术背后连着一个什么新技术，而其又是否会成为引爆下一场技术革命的关键。

有人说，面对未知的科技创新，舆论要做的就是少做自以为是、妄自尊大的判断，少做界定、多留空间。诚如斯言，不因点滴进步就盲目自大，不因一时挫折便心灰意冷，亦不因眼下“有没有用”去阻碍努力，更不搞恶意炒作、投机取巧，惟有如此，才能营造支持创新、鼓励试错的环境和氛围。

（五）

打逆风球、走上坡路、后发先至，是中国创新最为熟悉的奋斗故事。

面对立国之初的一穷二白与敌对势力的孤立封锁，“两弹一星”横空出世，铸就保卫共和国的利剑；遭遇近乎垄断的市场形势与行业龙头的倾销打压，液晶面板、光伏组件逆境突围，后来居上取得市场话语权；面对成败难测的科技前沿和未曾走过的研发之路，特高压、量子通信引领全球之先，在世界奠定中国标准……

70多年一路走来，中国一再用事实证明，我们在科技创新方面有着无穷潜力和强大行动力。今天，人工智能的历史车轮已经滚滚而来。据估计，2023年全球生成式人工智能的市场规模将达426亿美元，到2026年，这一数字将达到981亿美元。无论是Sora还是其他人工智能工具，未来都可能给人类世界带来更多惊喜和颠覆性的变革。

当此之时，我们更须坚定不移地细化政策支持，做好人才培养，完善奖励机制，保护知识产权，为国产AI发展培育好土壤。与此同时，继续扛起全球化的大旗，在开放中交流，在互鉴中发展，用好全世界的智力资源一起做好AI技术。

说到底，科技不是玄学，只要坚持不懈地投入时间、耐心和毅力，任何困难都能被克服。

（六）

“很快我们将不再讨论人工智能，因为人工智能已经融入到生活中，无处不在。”

对人工智能的利用，将会在国家之间、机构之间，甚至包括人与人之间形成新的代差和数字鸿沟，并推动人类从农业文明、工业文明走向数字文明。

梦在前方，路在脚下，今日中国拥有比过去任何时候都好的创新基础、创新条件与创新资源，拿出坐冷板凳、啃硬骨头的静气，脚踏实地、一往无前，一定会继续创造属于中国的传奇。

文/鲍南

图源/视觉中国

编辑/姬源

打开北京青年报APP阅读原文