北京青年报
不管“天空”多远,我们踏实赶路吧
北京日报客户端 2024-03-03 09:00

近段时间,OpenAI发布了其首个人工智能视频生成模型Sora。它以日语中的“天空”一词命名,寓意着“无限的创造潜力”。

相较于市面上其他竞品仅能生成不足10秒,且镜头视角单一、内容往往失真的视频,Sora的视频生成长度不仅突破到了一分钟,且能实现单视频的多角度镜头切换,最大限度还原现实世界的真实场景。

大幅跃进的视频生成能力,如同当年ChatGPT横空出世一般,再度向世人展示了人工智能所蕴含的惊人潜力。

对此,有中国互联网巨头承认旗下视频大模型“目前还无法作为完善的产品落地。”也有知名互联网企业家直言“中美人工智能差距在拉大。”

如何看待这种差距,如何缩小这种差距,如何面对新一轮全球科技竞争,值得我们思考。

(一)

对利用人工智能技术生成内容,大家并不陌生。

自ChatGPT出现后,AI编程、AI绘画、AI音乐等产品如雨后春笋般出现。虽然很多方面仍不完美,但凭借极高的生产效率,AIGC技术已经开始替代一些初级程序员、美工岗位,无比真切地向世人宣告“AI革命”正式来临。

但无论是聊天对答如流的ChatGPT,还是画画栩栩如生的Midjourney,本质上都只能依靠数学公式和文字规则输入和输出二维信息,没有真正与三维世界建立联系。而在现实中,即便是动物也可以依靠运动真实地和物理世界进行互动。因此,虽然大模型技术足够惊艳,但业界普遍认为其距离通用型人工智能仍有10年以上的差距。

但Sora不一样了!

从具体演示看,Sora已经拥有了叫做三维一致性的新能力。即其生成的视频,人物及场景元素可以随着视角的移动和旋转,在三维空间中仍然保持一致的运动状态。这意味着,大模型所存在的“涌现”现象,可以帮助其通过观察和学习来了解物理规律,构建逼真的三维物理世界,也就有了更进一步影响真实世界的能力。

从这个角度来说,Sora并不是简单的“视频制作工具”,而更像是某种“世界模拟器”,证明了大模型具有“打破次元壁”的能力。

有人断言,“一旦人工智能接上摄像头, 把所有电影都看一遍,把所有短视频都看一遍,那么就真的距离通用型人工智能不远了,一两年就能实现。”

(二)

现象级产品,再度让人看到了人工智能技术所拥有的无限可能。而这样的突破,也搅动着国内舆论场。

综合看来,虽然我国目前的人工智能产品中,确实尚难有堪当Sora竞品者,但将此归结为难以逾越的“创新鸿沟”恐怕也有些夸大其词。

要知道,早在1710年,莱布尼茨就在《神正论》中提出建立一种普遍语言的设想,“这种语言是一种用来代替自然语言的人工语言,它通过字母和符号进行逻辑分析与综合,把一般逻辑推理的规则改变为演算规则,以便更精确更敏捷地进行推理”。“莱布尼茨之梦”被视为是现代人工智能的雏形。

1956年,达特茅斯会议正式召开,“人工智能(Artificial Intelligence)”一词获得与会者一致认可,相关学科由此正式启幕。然而,人工智能学科尽管群英荟萃,很多国家的科研机构也投入了大量金钱,也不断有重大研究成果问世,但受限于当时计算机技术的发展水平,人工智能的发展速度远远低于预期,直到2006年,第一个使用GPU来训练的深度卷积网络出现,人工智能的第三波浪潮才奔涌至今。

透过人工智能的曲折发展史可以看到,一项技术的发展既需要深厚的知识积累,也需要其他科技发展达到一定水平。

而在信息产业方面,中国无疑是后来者、追赶者,指望在人工智能前沿领域中,一出手就直达世界最先进水平,显然很不现实。

但中国作为成长中的创新型国家,一直在奋力奔跑、努力赶超。尤其是作为工具,人工智能终究是要拿来用的,而正如高铁、手机、新能源汽车等产业的“后发先至”一般,在超大市场规模、完整工业门类和庞大用户基数的支持下,中国的AI会遇到无比丰富的使用场景,进而快速修正问题。在自动驾驶、智能制造等方面,中国已经证明了这种优势。

因此面对“中美AI差距是否在拉大”的担忧,也有业内人士指出,中美在AI上的差距主要在于“确定技术方向”上,一旦方向确定,中国学习能力快的优势就能马上激发出来。

(三)

总体来看,Sora的出现,是人工智能大模型技术研究达到一定阶段的产物。

我们不必将单一产品过分“神化”,妄自菲薄嗟叹“为什么它没有诞生在中国”,但借鉴“大模型”技术的发展经验教训,能够为我国的自主创新之路提供助益。

就我国AI相关产业发展情况看,除了起步晚、人才少,重“盖房子”轻“打地基”的情况确实不同程度存在。许多创业者虽然有想法、有技术、有资金,但时间与效率焦虑过重,很容易在资本裹挟下变得短视。

比如,在机器视觉、语音识别等人工智能方向取得重大进展后,国内一些企业就开始追逐热点,将精力与金钱投入虚拟币、NFT、元宇宙等时髦概念,不再去深挖产品背后的技术逻辑,浪费了领先优势。

比如,在国外一些公司将产品开源后,就有人就将其“套壳”冒充自主研发,对芯片等掌握在别人手里的“硬科技”也不愿进行研发投入,看似创新成果不断,但本质上仍然是“造不如买、买不如租”的逻辑。

今天,新一轮科技革命和产业变革风起云涌,经贸科技领域政治化、工具化问题愈发严重,发达国家的创新步伐从未停歇,对别国的技术打压也愈发严苛,摆在追赶者面前的攻坚大环境并不友好。

在自己的地基上盖好房子,才不会有“倾覆之虞”。此时此刻,从“应用创新”大国,迈向“原始创新”强国,在众多技术路线的初始逻辑里刻入更多“中国人自己的东西”正变得十分紧迫。这容不得半点投机取巧、急功近利,必须心无旁骛、凝神静气。

(四)

“从0到1”从来不易,攻坚之难与现实差距客观存在,技术攻关、产品磨合、生态重构,每一个步骤都需要投入巨大的精力。

尤其是在人工智能技术空前发展的今天,科技创新生态在前所未有革新,科学的深奥程度也远超想象。做好技术攻坚不仅需要科研人员焚膏继晷、埋头苦干,更需要社会舆论保持定力、稳住心态。

在ChatGPT和Sora出现之后,有一种论调甚嚣尘上,即认为这个东西“不能帮助美国发展工业;不能让美国重返月球;不能让美国重新工业化”,所以Sora及ChatGPT都“没用”。

这无疑是狭隘偏误的。

从蒸汽机与纺织业结合引发工业革命,到美国军用通讯系统发展为全球互联网,再到让电子游戏画面更精美的GPU成为AI算力芯片的基础……历史一再证明,技术演进具有不可测性和爆发突然性,人类的科技发展不是科技树式的,而是开盲盒式的,我们并不知道一个看似不起眼的技术背后连着一个什么新技术,而其又是否会成为引爆下一场技术革命的关键。

有人说,面对未知的科技创新,舆论要做的就是少做自以为是、妄自尊大的判断,少做界定、多留空间。诚如斯言,不因点滴进步就盲目自大,不因一时挫折便心灰意冷,亦不因眼下“有没有用”去阻碍努力,更不搞恶意炒作、投机取巧,惟有如此,才能营造支持创新、鼓励试错的环境和氛围。

(五)

打逆风球、走上坡路、后发先至,是中国创新最为熟悉的奋斗故事。

面对立国之初的一穷二白与敌对势力的孤立封锁,“两弹一星”横空出世,铸就保卫共和国的利剑;遭遇近乎垄断的市场形势与行业龙头的倾销打压,液晶面板、光伏组件逆境突围,后来居上取得市场话语权;面对成败难测的科技前沿和未曾走过的研发之路,特高压、量子通信引领全球之先,在世界奠定中国标准……

70多年一路走来,中国一再用事实证明,我们在科技创新方面有着无穷潜力和强大行动力。今天,人工智能的历史车轮已经滚滚而来。据估计,2023年全球生成式人工智能的市场规模将达426亿美元,到2026年,这一数字将达到981亿美元。无论是Sora还是其他人工智能工具,未来都可能给人类世界带来更多惊喜和颠覆性的变革。

当此之时,我们更须坚定不移地细化政策支持,做好人才培养,完善奖励机制,保护知识产权,为国产AI发展培育好土壤。与此同时,继续扛起全球化的大旗,在开放中交流,在互鉴中发展,用好全世界的智力资源一起做好AI技术。

说到底,科技不是玄学,只要坚持不懈地投入时间、耐心和毅力,任何困难都能被克服。

(六)

“很快我们将不再讨论人工智能,因为人工智能已经融入到生活中,无处不在。”

对人工智能的利用,将会在国家之间、机构之间,甚至包括人与人之间形成新的代差和数字鸿沟,并推动人类从农业文明、工业文明走向数字文明。

梦在前方,路在脚下,今日中国拥有比过去任何时候都好的创新基础、创新条件与创新资源,拿出坐冷板凳、啃硬骨头的静气,脚踏实地、一往无前,一定会继续创造属于中国的传奇。

文/鲍南

图源/视觉中国

编辑/姬源

相关阅读
朝阳区举办AIGC视听产业创新中心主题展示
北京青年报客户端 2024-10-11
2024中关村论坛年会|齐向东: 人工智能带来的安全难题,还是要用人工智能来解决
北京青年报客户端 2024-04-27
视频编辑或迎来变革!Adobe开辟新路径:探索与OpenAI合作
财联社 2024-04-18
AI迈入视频时代影响几何
经济日报 2024-03-30
全球科技股浪潮奔涌而来 机构关注AI投资主题
上海证券报 2024-03-18
Sora为何没能诞生在中国?
中国新闻周刊 2024-03-16
风起大模型:国内大厂“应战”Sora
21世纪经济报道 2024-03-09
以“人工智能+”撬动新质生产力发展:怎么看?怎么用?怎么做?
成都商报 2024-03-07
最新评论