11月25日,由度小满与中科院自动化研究所、中关村科学城联合举办的“中关村博士后学术交流论坛”在北京召开。中国工程院院士邬贺铨、度小满CTO许冬亮、中国科学院自动化研究所研究员、博士生导师宗成庆等行业专家以及来自北京智源人工智能研究院、启明星辰等中关村高校、企业的博士后参会。
邬贺铨院士在主题演讲“从大模型到智能体”中,详细阐述了AI Agent与大模型的差异,并预测了AI Agent在智能驾驶、金融、工业、终端等领域的应用前景。
邬贺铨院士认为,“大模型的落地应用正在从模型层走向智能体(AI Agent)。智能体与大模型相比,不会只依赖于精心编辑的预训练数据,解决了大模型难以支撑企业内场景应用的问题,有望成为强大的通用问题解决方案。如果说大模型是智能手机的操作系统,那么智能体相当于APP Store。”
(邬贺铨院士发表主题演讲)
他认为AI在金融领域的应用还处于开始阶段,还有待深入开发,在AI获客、对小微企业经营数据的获取、贷款人在其它贷款平台上行为的了解、可质押物的监管状态等方面还有很多工作要做,AI及智能体还可以在这些方面发挥作用。
度小满CTO许冬亮介绍了度小满在金融大模型领域的探索实践。度小满近期发布的开源大模型“轩辕3.0”在各项金融评测任务上表现优异,评分超越了名列前茅的各大中文开闭源模型,在金融事件解读、金融业务分析、投研应用能力和风险管理等测量维度上超过了GPT4o。
(度小满CTO许冬亮致辞)
许冬亮表示,“度小满自从去年发布‘轩辕’金融大模型以来,已经开源发布的全参数模型矩阵达19个,可以满足不同金融领域开发者需求。我们坚持金融大模型的持续开源,希望可以降低金融机构应用大模型的门槛,让金融可以更有效率地服务实体经济。”
赵阳副研究员在论坛上介绍了多模态机器翻译的最新进展和挑战。赵阳表示,随着技术的发展,用户对翻译系统多模态交互能力要求越来越高。目前市面上接触到的级联式方法在实际业务展占据主流,端到端方法依然有差距,未来探索方向包括开放场景的文本图象翻译、基于大模型的图像翻译和图像翻译的轻量化技术。
(中国科学院自动化研究所副研究员赵阳发表演讲)
谈及大模型解读征信报告的关键挑战及解决方案,度小满出站博士后李祥表示,征信报告解读涉及风险偏好识别、领域专家知识综合能力以及超长文本信息挖掘能力三个关键能力。在这方面,度小满的轩辕系列金融大模型展现出了显著的优势,有效弥补了开源模型的不足。
面对大模型在金融领域应用面临金融知识不全面、金融能力待提高等挑战,度小满在站博士后霍亮宇认为,通用大模型进行“金融对齐”升级,能够使模型在金融领域具备更高的专业能力和安全性。数据显示,对齐训练后模型显著提高模型能力,金融和通用领域相比相比对齐前的模型胜和率超80%。
北京智源人工研究院博士后钱泓锦首先回顾了RAG技术的发展历程,RAG1.0时代的检索器和生成器是分开优化的,导致检索系统依赖于语义匹配的方式,存在效率和准确性的局限。RAG2.0通过定义检索器和生成器的联合优化,使得检索器在检索时能够知道生成器需要什么,生成器在生成时能够感知到其他全局信息,从而显著提升了生成质量。
对于大模型如何提升可靠性、安全性,北京启明星辰信息安全技术有限公司博士后周瑜认为,近年来大模型取得了显著进展,但不同业务阶段仍然存在安全风险,现在主流的安全策略为安全对齐和主动安全防护。展望未来,大模型安全测评的挑战将来自技术发展的动态性和数据获取与标注的难题等方面。
(中国科学院自动化研究所研究员、博士生导师宗成庆对学术报告进行总结)
最后,中国科学院自动化研究所研究员、博士生导师宗成庆对博士后论坛的学术报告进行了总结,他鼓励博士后聚焦企业面临的实际问题探索大模型落地应用的创新方法,使大模型在服务于特定领域的实际任务中充分发挥作用,既体现其性能优势,又不至于投入太高的成本。同时他强调了技术创新的重要性。他认为,企业博士后作为国家高端技术人才,应该勇于站在人工智能技术发展的前沿为解决企业面临的技术瓶颈问题提出原创性的解决方案,在学习和跟踪国际先进技术的同时在大模型理论方法或技术应用方面大胆突破。
文/金仁甫
编辑/范辉