北京青年报

AI应用落地提速：大模型开花小模型破局

21世纪经济报道 2024-07-13 12:06

大模型的热度依然不减。

日前，百度董事长兼CEO李彦宏在2024世界人工智能大会（WAIC）产业发展主论坛演讲称，2023年国内出现百模大战，这造成社会资源的巨大浪费尤其是算力浪费，但也使得中国追赶世界上最先进的技术模型能力得到建立。

毫无疑问，大模型已经成为当今的生产力明星，而竞争也趋于白热化。就在不久前，国内模型厂商掀起了一轮大模型降价潮，厂商们试图通过降低成本抢占市场，背后是基于基座大模型的应用在各行各业落地开花。降价无疑会加速这个趋势。

“虽然只有短短一年时间，但变化还是非常大，大家已经从去年关注大模型本身，转变为思考或讨论大模型本身怎么来创造价值，怎么来赋能产业，怎么来落地应用。”智谱AI公司CEO张鹏向21世纪经济报道记者表示。

华金证券研报称，中国10亿参数规模以上的大模型数量已超100个，行业大模型深度赋能电子信息、医疗、交通等领域，形成上百种应用模式，赋能千行百业。

不过眼下，业内期待的是大模型与行业更深度的融合。容联云产业数字云VP兼诸葛智能创始人孔淼向记者表示，行业知识和业务理解在大模型应用中至关重要，它们是有效解决方案的基础，需要深入了解特定行业的独特需求、流程，以及对企业如何运作和实现业务目标有更加全面的认识。

细分、个性化的需求逐渐增多，大模型也难以兼顾全部，应用场景有限、效果参差不齐、高质量训练数据缺乏等问题阻碍着大模型的落地，相当一部分企业陷入了对该技术的焦虑当中。

如何用、怎么用，一度困扰着想要跟上这波技术浪潮的企业，这背后的根源或许并不在于大模型本身，而是回归企业自身需求。

落地广泛

近期的大模型降价潮让应用端焕发生机。张鹏认为，大幅度降价的出现主要源于技术驱动，“技术不断提升，生产成本逐渐降低，从而导致价格持续下降。”不过他表示，过度的降价并不是合理的商业模式，降价不会持续很久。

但对于开发者来说，降价是一个利好消息，有助于创新和应用的开发。在大模型时代，拥有强大的应用能力可以成为企业的核心竞争力。

在百度创始人、董事长兼首席执行官李彦宏看来，大模型的重点还是“卷应用”，“没有应用，光有基础模型，不管是开源还是闭源都一文不值。”

他在WAIC上发言表示，要跳出移动时代的思维逻辑，避免掉入“超级应用陷阱”，不是只有10亿DAU的应用才叫成功。

目前，大模型应用已在办公、企业服务等场景实现商业化前期的落地；文生图、文生视频等工具型AI应用已集中于消费者端，尤其是专业用户的覆盖比较广泛；与智能硬件结合的应用也是新的行业中新的趋势亮点，AI赋能智能手机、智能汽车、机器人等智能终端，目前这部分的融合仍处在相对初级的阶段，但未来空间广阔。

另一个明显的趋势是，市场需求正在发生演变，对通用大模型的关注度有所下降，垂直领域大模型逐渐兴起。

在业内人士看来，垂直领域大模型通常针对特定行业的数据和问题进行训练和优化，因此能够提供更高质量的结果。这种专业化是通用模型难以实现的。

目前，垂直大模型在多个领域有所应用。例如，润达医疗与华为云合作，开发了专注于医疗健康的“良医小慧”医疗AI垂直大模型，利用先进的自然语言处理技术提供专业的医疗建议和信息；蚂蚁集团推出百灵大模型，支撑起金融AI助理“支小宝”，能够提供个性化的金融咨询和投资建议。

而对于众多企业来说，他们寻求的是高度定制化的解决方案，建立企业私有大模型来完成企业内部业务的降本增效。

尤其对于那些拥有敏感数据的企业，如金融、医疗等行业，私有化部署可以确保数据在本地处理，避免数据传输过程中的泄露风险，同时也帮助企业遵守严格的数据保护法规。

无论是应用还是垂直模型，都是将关注点转移到了如何将大模型更好地实现落地、创造价值。这也要求技术提供者深入理解行业需求，创新解决方案，并与各方合作。

企业“头痛”

从落地的角度来看，业内对大模型逐渐祛魅，不再赋予其“无所不能”的想象。孔淼向记者表示，随着时间的推移，客户对大模型的需求正在逐步明确和收敛，这意味着客户对于他们需要什么样的产品或服务有了更清晰的认识。

不过，整体来看，大模型在各行业的应用场景和范式还相对有限，一方面，大模型目前主要应用于一些常见的场景，如文本分类、情感分析、机器翻译等，而在一些特定的业务场景或新兴领域中的应用还不够广泛。

另一方面，大模型在企业中赋能的实际情况参差不齐，这往往与企业和行业自身有着直接关系。“实践下来，大部分的客户很难拿通用大模型直接上手。”有大模型企业人士向记者表示，“企业的需求是很细致且个性化的，他们也很焦虑，生怕错过这波机遇。”

张鹏在WAIC的演讲中表示，企业在开发AI驱动的应用时，需要有一套能够支持这种开发需求的技术架构。这包括底层资源、技术组件以及开发人员的能力。如果现有的技术栈不能满足大模型落地的需求，企业可能需要构建新的基础能力，这将是一个耗时的过程。

高质量的训练数据也是一大问题，缺乏足够丰富和高质量的垂直行业训练数据，限制了大模型的训练效果和应用性能。

“垂类模型更多关注细分行业专有数据，既包括与个人相关的用户数据，还包括企业资产行业数据。”中科曙光集团智能计算产品事业部副总经理胡晓东表示。

但这些数据并不容易获得。在一些细分行业中，例如工业领域，获取数据相对困难，不仅数据量较少，而且往往不适合或不愿意在企业之间共享。

而中小企业更是一片数据洼地。达观数据董事长兼CEO陈运文向记者表示，许多中小型企业在过去缺乏统一的资料管理系统，通常分散在员工的个人电脑中，难以进行大模型的赋能。

“首要目标是建立一个集中的文档管理库，将所有员工的文档资料集中存储。在此基础上，可以构建大型模型和上层的智能化应用系统。”陈运文向记者表示，“这是一个逐步的过程，首先需要打好基础。”

下一步则是知识的深度挖掘。陈运文向记者表示，如果大模型与专业知识的结合仅限于表面层次，这是不充分的。只有当这种结合达到深层次时，垂直模型才具有真正的价值。行业知识的深度挖掘能够带来更深远的意义和应用潜力。

这时候仍需要人的力量实现对模型的微调。“要人类专家来传授经验，大模型要做定向的修改去吸收这些经验，最后开发出针对性的产品。”陈运文表示。

小模型破局

如果上述的问题在短期内得不到解决，行业与企业又该怎么办？是否意味着错过这波AI的浪潮呢？

张鹏在接受记者采访时提到一个有趣的点，当客户提出需求时，要深入了解客户需求背后的逻辑和根源，而不仅仅是“想用大模型”的表面现象，从而提供更有效的解决方案。

“要考虑业务是否适配，是需要一个类人的智能去解决这个问题，还是说只需要一个简单的计算器，”张鹏表示，“要做相应的分析，大模型并不是包治百病。”

也是在这个背景下，小模型作为大模型的有力补充，成为了众多企业更加切实的解决方案。“有时我们可能不需要或不适合使用大模型，而是需要相对较小的模型。特别是需要将领域知识、专家经验和逻辑推理引入到模型中。”华院计算创始人、董事长宣晓华在接受记者采访时表示。

小模型参数数量通常远少于大模型，针对特定的任务或领域进行优化，它们在这些特定任务上可能表现出与大模型相近或甚至更好的性能。尽管大模型在技术上具有领先优势，但小模型以其成本效益、灵活性和专业化特点，在大模型时代下发挥着不可或缺的作用。

例如，在工业领域的表面检测中，由于缺陷样本稀缺，传统的大数据方法在解决此类问题时面临挑战，而人类却能通过少量样本迅速识别出相似缺陷。宣晓华认为，通过将特定行业的知识和专家经验整合到AI算法中，不仅可以降低对大量数据的依赖，还能提升识别的准确性。这种方法使得人工智能在处理特定行业问题时更加高效和精确。

“我认为最重要的是找到合适的应用场景，追求规模本身并不是目标。如果能够使用较小的模型和数据有效地解决问题并提供良好的服务，就没有必要追求规模。”宣晓华表示，在解决特定行业或领域的问题时，需要重新考虑如何更有效地解决问题。

从投入产出比的角度来说，小模型的优势也十分明显，尤其是对于预算有限的中小企业。小模型可以在计算能力有限的设备上使用，降低了使用AI技术的门槛和成本，在资源受限的环境中适应不同的应用场景和需求。

孔淼也向记者表示，企业客户关注的是业务价值和成本效益，他们更倾向于购买能够带来明确经济效益的解决方案，而不仅仅是技术上先进但实际应用效果不明显的产品。

对于国家而言，这一点也很重要。宣晓华表示，当大家都追求大模型时，可能会造成很多浪费，包括算力资源。“人们可能会不加选择地购买大量算力，而算力本身也有很高的成本。因此，从应用场景的角度出发，思考需要什么样的模型，是解决问题的关键。”

面对AI浪潮，企业和行业更应该保持清醒的头脑，回归真实的需求。无论是大模型还是小模型，关键在于如何将这些技术与行业需求相结合，创造出真正的价值。

编辑/樊宏伟

打开北京青年报APP阅读原文