北京青年报

大模型乘风破浪 AI打通应用落地渠道

21世纪经济报道 2023-06-10 17:44

近年来，随着以GPT为代表的大模型技术不断演进，“通用性”成为人工智能发展的最新注脚。在业内看来，通用人工智能技术能够赋予产业发展新动力。

近日，在由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”上，多位专家、学者、企业高管共话“AI领域上市公司创新涌现、技术难题与发展路径”。

对于通用人工智能技术发展，工信部赛迪研究院电子信息研究所副所长陆峰表示，“人工智能已经从专用人工智能发展到通用人工智能的临界点，要高度重视未来人工智能化时代，人工智能应用将无处不在。”

与此同时，我国一大批科技企业正相继布局大模型技术与产业化落地，应用行业也正从办公、生活、娱乐等方向，向医疗、工业、教育等领域加速拓展。会上，多位参会嘉宾共同探讨了应用落地探索与挑战的话题。

图片来源：新华社

通用人工智能势起

中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机构编写的《中国人工智能大模型地图研究报告》显示，中国自2020年起进入大模型快速发展期，现已在大模型方面建立起涵盖理论方法和软硬件技术的体系化研发能力，形成紧跟世界前沿的大模型技术群。

从政策面来看，4月28日的中央政治局会议明确指出，要重视通用人工智能发展，营造创新生态。

5月5日的二十届中央财经委一次会议再次强调，要把握人工智能等新科技革命浪潮。

为推动人工智能创新发展，北京、上海、深圳等多地纷纷出台相关支持举措，集聚人工智能创新资源，抢抓大模型机遇，开展大模型创新算法及关键技术研究，打造人工智能创新高地。

据中国信通院测算，2022年我国人工智能核心产业规模达5080亿元，同比增长18%。与垂直人工智能相比，通用人工智能已经不局限于处理单一任务，实现了跨领域、跨学科、跨任务和跨模态的应用。

在陆峰看来，人工智能经过几次高潮和低潮，目前正经历第三次高潮非常关键的时刻。随着人工智能技术、算力、算法不断突破，为从数字化、网络化到智能化的跨越发展奠定了一些基础性的条件。

因此，他认为，要充分关注应用需求的紧迫性。“未来很多领域由于人口结构的变化，由于很多新生代对于传统劳动环境的不适应，所以必须要以机器来换人。”陆峰说。

根据IDC预测，2023年企业在人工智能技术上的投入将达到1540亿美元，增长27%，这或许意味着今后人工智能将释放巨大的市场需求。

中国科学院科技战略咨询研究院研究员周城雄认为，人工智能的发展有两个逻辑在起作用，一个是技术逻辑，还有一个是政策逻辑，可以说当前政策逻辑在其中起着很大的作用。

他指出，中国人工智能政策方面，包括《中国制造2025》、《新一代人工智能发展规划》等相继出台。近期网信办发布《生成式人工智能服务管理办法（征求意见稿）》，对生成式人工智能，包括社会公德、个人信息、数据方面将进行规范。

周城雄认为，社会主体的价值在于加速人类体力、脑力和创新能力的解放，现在人工智能是加速人类创新能力的解放。他进一步指出，近期调研中，已经明显感受到人工智能逐渐发挥更多的作用。

“现在高校实验室有一些实验都是机器人在完成，有的人工智能技术还可以阅读上万篇文献后写出一个文献摘要，还有的通过关键词输入就可以写学术论文。”周城雄表示。

技术端、产业化对齐未来

“不管元宇宙也好，还是AIGC也好，都是在提升效率。在整个AIGC的应用过程中，做垂类的应用是有很多空间的。实际上GPT出现以后，以前的一些人工智能模型也还是可以优化的。”北京人工智能产业联盟元宇宙专委会主任、大数据分析与应用技术国家工程实验室网信智能中心副主任颜阳指出。

颜阳认为，人工智能除了要有技术上的突破，还要有商业模式的突破。在突破技术瓶颈的过程中间一定要找准自己的商业模式，很多不是大流量平台的机构肯定做不到OPENAI平台那种对C端市场的梅特卡夫效应，但是要非常关注整个过程在B端市场的双边市场效应。

他表示，从技术角度看GPT，它现在最根本依赖的Transformer模型，其底层较多涉及向量矩阵的点积计算，因此通过硬件在处理这些运算时还有很多的优化空间。因此，综合考虑存储、传输和计算的整体影响，通用GPU大概率开始向专门支持Transformer的AI加速的方向转移。

另外，颜阳认为，根据Transformer的基本原理来看，很多模型可以做优化的，例如不一定需要同时加入编码器和解码器等等，而需要根据场景来做匹配。未来在整个生态过程当中，有可能是群雄逐鹿。

但他同时指出，整个GPT模型也并非一股脑往大做就是最好，因为根据有关机构测试表明，大模型大数据的模型在训练时的损失也会很大，但如果从U形的两头突破（也即是小数据大模型或是大数据小模型），可能是中国“沙丁鱼”出圈的契机。

在他看来，金融行业或许会有很大的应用空间。现在金融行业应用较少，部分原因是用一些大模型对数据精准的计算不太友好，但现在开源模型稍微修改以后对结构化的数据反而很有效。前几年用逻辑回归都能做到这种程度，现在有大模型加持的情况下，把使用门槛大幅度降低，海外已经有对小盘股股指做预测的实验室案例。

另外在科学研究领域，他认为，大模型在结构生物学方面也还是有很大空间，虽然说Alphafold2此前在蛋白质结构预测方面取得了重大成就，但还有很多涉及算力与数据不足的有待改善的方面，为我国在该领域的垂类应用带来了非常大的想象空间。在IT领域里DBA（数据库管理员）的工作也是相对复杂的，现在通过Text to SQL，也可以提升DBA工作的效率。

“我们也在做国产化，第一步先把开源做起来，例如我们把相关的代码转起来以后，就可以形成自己的开源生态，例如现在虚拟空间的NPC都可以用AIGC形成，支持商业合作伙伴直接使用，如果他们用起来非常方便，也非常低廉，此后便可以开始进行循环迭代。”颜阳称。

“以前说是奇点已来，现在我们期望：跨越奇点，对齐未来。”颜阳表示。

应用落地探索与挑战

人工智能在大模型泛化的过程中，企业更多是立足于自身背景和产业优势进行布局。会上，多位科技企业负责人提到了在研发以及应用落地的过程中面临的挑战。

昆仑万维（300418.SZ）CEO方汉介绍道，在商业化方面，公司采取To B跟To C并重的战略。据悉，2022年12月，昆仑万维正式发布“昆仑天工”，其AI生成能力已覆盖图像、音乐、文本、编程等内容模态。今年4月17日，昆仑万维正式发布天工大语言模型。

B端方面，方汉总结道，如何把行业数据生成大模型可用的数据是最难的事情。他表示，国内非常多的企业都缺比较好的数据，国内现在要To B的应用，要帮助所有行业把现有的知识推导过程给补上，不能光有题目跟答案，而要把推导过程给列出来，这样才能让各个行业去利用。

谈及海外市场拓展，他认为中国企业最适合的是C端市场，在海外的C端市场可以做端到端的内容生成工具。“这个听起来比较简单，但实际上目前所有的AIGC工具都不是端到端的内容生产工具，而是素材生产工具。”方汉称。

另外，在方汉看来，端到端内容生成工具仍有一个技术难点没有解决，一旦解决了一致性的内容生成之后，整个影视行业、短视频行业都会被颠覆，而且一致性视频生成有望在1-3年之内取得突破。最迟3年以后，人类将可以用AI来生成一致性非常强的长视频。

拓尔思（300229.SZ）拓天大模型预计在6月底前推出。会上，拓尔思副总裁林松涛表示，大模型技术场景落地中的挑战，主要是质量、可控、时效和成本。

质量方面，他认为，个人服务用ChatGPT，提示词不准可以换一个，如果图片生成不好也可以再换一个，可以说个人对AIGC的容忍度是很高的。但是企业不一样，给政府写顾问报告，数据来源必须是准确的。

可控层面，一是内容安全，数据是有价值观的，模型没有价值观。二是私域数据安全，中国大模型要数据化落地，如何在保证用户私有数据安全的同时将大数据较好地运用也是一个问题。

时效方面，在大数据训练上，灾难性的遗忘一直都是训练的问题，所以需要大模型解决这个问题。另外，怎样输入即时数据，类似Chat GPT，数据最新只到2021年9月，因此在To B服务的时候用不好。

成本方面，千亿模型私有化落地的时候需要训练好，在企业端落地还需要让企业用得起。拓尔思做To B服务，垂直场景落地成为“百模大战”的核心要点。

此外，中科闻歌于6月3日发布雅意大模型，推出了媒体、金融、宣传等领域的大模型应用。会上，中科闻歌副总裁、首席产品官汪小东亦表示，当前做大模型有生态、场景、测评机制、算法等四方面的挑战。

“生态方面，现在国内开源生态还比较弱。场景方面，现在落地场景还比较少，存在场景的欠缺。用户侧如何贡献数据也至关重要。国内成体系的较科学的模型测评机制尚欠缺。各家模型水平需科学公开公正评定，这样才能规范市场，促进良性发展。同时，针对大模型幻觉等问题，算法上的持续创新和突破也是大的瓶颈。”汪小东称。

编辑/樊宏伟