北京青年报

百融云创张韶峰：漫长的大模型赛道垂直领域已在悄悄闪耀

北京青年报客户端 2023-06-13 14:58

这是一个以大模型为核心的人工智能新时代。

人工智能技术正在积极赋能千行百业。相比通用大模型，针对特定行业训练的大模型在垂直领域的智能交互中表现更佳。一个典型的例子是，彭博推出的大模型Bloomberg GPT在实时的金融数据处理等方面超越了ChatGPT，展现出了更强的专业性。

原因何在？以大模型的三大核心战斗力（算力、算法和数据）来比较的话，若论算力层面，ChatGPT可谓是碾压式的存在。根据公开信息，GPT 3的参数高达1750亿，市场预估，GPT 4的参数至少可达万亿级别。而Bloomberg大模型的参数为500亿。

答案落脚在了算法和数据层面。

“行业大模型强调两项关键能力：算法调优与行业积累。”百融云创CEO张韶峰在近期的投资路演中分析道。

作为垂直类金融AI头部平台，百融云创（百融云-W，6608.HK）近日完成了AI大模型BR-LLM的升级。此次升级不仅增强了大模型的预测精度和响应速度，同时通过底层机器学习算法调优，大幅度提高了模型的普适性，适应不同金融场景的定制化需求。

中国金融版大模型的内在机理

与彭博大模型理念相一致，百融云创的AI大模型可视为中国金融版的GPT模型。

据了解，BR-LLM同样是建立在Transformer的架构之上，利用深度学习中的多头注意力机制拟合人机交互方式，从而能在复杂交互中实现强大的处理和应答能力。

与通用大模型不同的是，BR-LLM由多元化的AI组合策略驱动，这其中既包括分析、判别与预测算法，也包括生成式算法（AIGC），另外还有智能交互等技术。

对此，张韶峰解释道，对于金融行业来说，仅仅依赖生成式AI并不能满足所有的需求。他称，在信贷、财富管理、保险等业务领域，需要判别型算法进行智能分析和决策制定；在智能运营、精准营销等业务领域，则高度依赖AIGC来帮助金融业降本增效。

一个例子可以说明判别类算法对于金融领域的不可或缺性。几年前，一家知名银行遭遇团伙欺诈，犯罪分子利用虚假信息成功绕过银行的信用检测，批量申请贷款，短短一天之内，这家银行被骗走10亿资金。

这是一则教科书式的金融欺诈启示录。它不仅带给金融业以长足的警醒作用，也令判别式AI的技术力量更加深入地与金融场景融合。

“垂直行业AI大模型的内在机理既着重于通用的自然语言处理（NLP）和AIGC技术，也要基于行业特色结合其他算法。这样的大模型设计思路能够更精确地理解和满足行业的复杂需求，提供更高效和定制化的解决方案。”张韶峰总结道。

模型调优，大幅提升运营效率

据张韶峰介绍，尽管BR-LLM融合了不同类型的AI算法，但其底层技术本源是相通的，既依赖于深度神经网络和注意力机制构建的自动机器学习建模平台。

撑起百融云创营收的三大业务板块——智能分析与运营、精准营销及保险营销均蕴含了AI算法。特别是智能运营业务线，集纳了判别式AI算法、AIGC和实时智能交互算法，该业务线也是百融云创近几年增长最快的分支，财报显示，该业务线营收在2022年同增144%，今年一季度同比增长达68%。

在张韶峰看来，对于AI算法的不断优化和调整成为公司提升业绩的关键因素。近几年，百融云创不断将资源向算法研发倾斜。截至目前，百融云创研发投入已经超过14亿元。

以判别式AI算法来说，张韶峰称，其背后蕴含一大技术利器：即由知识图谱和机器学习构建的复杂关系网络。

在模型优化上，张韶峰将其形容为“用算法对抗算法”。简单来说，是构建一个“对抗性”的生成网络，同时结合生成式的建模平台和判别式的虚假信息识别能力。伴随模型性能的不断提升，可以毫秒级反馈交易反欺诈场景，对欺诈风险识别的准确率接近90%。

除了信用评分和欺诈检测，百融云创在针对智能交互的模型算法上也在不断精进。百融云创智能语音机器人（Chatbot）是AIGC技术在金融领域中的一项重要应用。与通用大模型不同的是，百融云创Chatbot不仅仅是文本之间的交互，而是集“文本+语音”于一体的多模态交互模式。

根据张韶峰介绍，一次完整的智能语音机器人交互过程是：“用户画像-生成初始文本-合成语音反馈用户-ASR分析语音并转化成文字-NLU实时处理文字生成语音。”如此循环往复。

“经过反复训练，目前百融云创智能语音机器人可以连续对话20—30轮不卡顿，且对于客户的语音识别准确率能达到99%以上。”张韶峰说。

行业know-how对抗“机器幻觉”

据了解，百融云创智能语音机器人每日的交互规模在业内位居首位。这一成绩的达成，除了技术优势之外，张韶峰认为，专属语料库的精心“喂养”也起到了决定作用。“除了优化算法，深度的行业洞察也是垂类大模型不可或缺的。”

这也符合主流的研判观点。业内对此有个形象的比喻：如果说算力是AI的“石油”，那么，数据便是“矿井”。

分析普遍认为，行业语料的培育可以对抗一些通用大模型存在的“机器幻觉”弊端，即大模型自信满满地给出若干错误信息。

能做到对抗“机器幻觉”，与百融云创历时九年深耕金融行业的点滴积累分不开，截至2023年3月末，百融云创在中国累计为超过7000家金融机构提供服务。同时，国内金融行业数字化转型步伐提速也为其提供了良好的发展土壤。

而为了用好行业语料，百融云创突破性将云原生平台与大模型深度绑定，再以MaaS（模型即服务）模式使得模型便捷地部署在不同的金融业务场景中。

在具体实现上，百融云创将金融和非金融行为信息生成为结构化标签，继而转化为直观和可操作的洞察，包括消费者信贷评估、精准营销、风险管理指

文/金仁甫

编辑/范辉