北京青年报

半两财经 | chatGPT迅速演进国内科技巨头纷纷布局密集发布产品

北京青年报客户端 2023-04-09 13:23

4月7日晚，阿里云大模型“通义千问”启动邀测。至此，包括百度、阿里、京东等大公司均已公开发布大模型产品。北青报记者了解到，目前尚有多个公司已有或正在研发类chatGPT产品，分析认为，未来一段时间内，各公司将会密集布局相关产业和应用，4-5月将是产品密集发布期。

百度首发“文心一言”大模型

百度是国内首个公布对标ChatGPT产品的大厂。3月16日，百度发布了大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

比如在商业文案创作场景中，文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题，文心一言能理解题意，并有正确的解题思路，进而像学生做题一样，按正确的步骤，一步步算出正确答案。

百度介绍，文心一言是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术，ERNIE和PLATO中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是文心一言未来越来越强大的基础。

在商业化方面，已有超过650家企业宣布接入文心一言生态。李彦宏预测，大语言模型将带来诸多产业机会。文心一言将通过百度智能云对外提供服务，帮助企业构建自己的模型和应用，农业、工业、金融、教育、医疗、交通、能源等重点领域，都会因此效率大幅提升，并在每一个行业快速形成新的产业空间，助力数字中国的实现。李彦宏预告称，百度智能云也在一周后举办了发布会，主题围绕文心一言的云服务和应用产品，既有公有云服务和也可以做私有化部署。此外，百度文心大模型已经在电力、金融、媒体等领域，发布了10多个行业大模型。

阿里云“通义千问”开启邀请测试

4月7日，阿里云大模型“通义千问”启动邀测。据介绍，“通义千问”是一个专门响应人类指令的大模型。这款产品类似于chatGPT和文心一言，用户可以在线与它对话。

打开“通义千问”产品页面，用户可输入不多于1000字的问题，“通义千问”会很快给出回应。页面提示称，用户还可以让它“撰写短文”“写封邮件”“电影脚本”或者帮助写“职场报告”，甚至“撰写代码”。

不过，通义千问目前仅支持文字生成，目前不支持画图、语音、视频等多模态生成。当北青报记者让其“画一幅画”时，它回复“作为一个语言模型，我无法画出图片。但我可以用文字来描述一幅画。”随后还为自己描述了一副简单的画面。而当让它创作视频时，他回答“作为一个语言模型，我无法创作视频。但我可以为您提供一些关于视频创作的建议”。

此前据阿里研究院公布的信息显示，阿里巴巴达摩院在2020年初启动中文多模态预训练模型M6项目，在阿里云内部，M6大模型的应用包括但不限于在犀牛智造为品牌设计的服饰已在淘宝上线、为天猫虚拟主播创作剧本，以及增进淘宝、支付宝等平台的搜索及内容认知精度等，尤其擅长设计、写作、问答，在电商、制造业、文学艺术、科学研究等前景中落地。

腾讯生成式AI先应用于内部场景

3月22日，腾讯在业绩会上透露，生成式AI可以用来提升腾讯旗下旗舰产品的用户体验，未来可能每一个用户都会有人工智能助理，如果效果好，有可能将生成式AI纳入微信和QQ。

此前，2月初腾讯旗下腾讯研究院发布《AIGC发展趋势报告2023》，报告指出，在广告领域，腾讯混元AI大模型能够支持广告智能制作，即利用AIGC将广告文案自动生成为广告视频，大大降低了广告视频制作成本。

AI大模型方面，腾讯表示正大力投入人工智能与云基础设施建设，腾讯混元AI大模型覆盖NLP（自然语言处理）、CV（计算机视觉）、多模态等基础模型和众多行业与领域模型，还推出了万亿中文NLP预训练模型。

腾讯总裁刘炽平表示，腾讯不会匆忙推出产品，而是将花费时间打造一个经过多次迭代后的长期发展机会。腾讯将充分利用自身资源，如基础设施、数据和云计算基础设施，以及打造人工智能应用的长期实践，为聊天机器人产品打造基础模型技术。还将提高既有业务的增长和变现能力，同时寻找新的商业模式。

华为布局用于行业的大模型“盘古”

今年2月，华为公司在回答“华为在类似ChatGPT方向的布局”采访问题时表示，华为公司2020年开始在大模型有布局，2021年发布鹏城盘古大模型，是业界当时首个千亿级生成和理解中文自然语言处理大模型。之后，又陆续发布行业大模型系列。

据华为相关人士介绍，华为的大模型重点在于行业应用。当前，华为云基于盘古预训练大模型，打造了药物分子大模型、气象大模型，以及矿山、电力、金融、轨道等行业大模型，让人工智能开发标准化、可复制、批量化生产，为行业创新带来新的思路、新的方法及新的工具，加速AI深入千行百业，为行业应用带来突破性的进展。

京东推出产业版“ChatJD”

今年2月10日，京东云宣布将推出产业版ChatGPT：ChatJD。ChatJD智能人机对话平台，预计参数量达千亿级，将率先落地在零售、金融等两个领域。

京东方面认为，ChatGPT在通用性方面已经展现出强大的能力，但在忠实度、可信度、精准度方面还存在一些不足，这主要是由于在中间层缺少垂直的产业知识和领域知识，难以在真实应用层广泛落地开花。基于产业需求，京东云旗下言犀人工智能应用平台将推出ChatJD，定位为产业版ChatGPT，旨在打造优势、高频、刚需的产业版通用ChatGPT。

ChatJD 落地应用路线图，包含一个平台、两个领域、五个应用。1个平台：ChatJD智能人机对话平台，即自然语言处理中理解和生成任务的对话平台，预计参数量达千亿级。2个领域：零售、金融，得益于京东云在零售与金融领域10余年真实场景的深耕与沉淀，已拥有4层知识体系、40多个独立子系统、3000多个意图以及3000万个高质量问答知识点，覆盖超过1000万种自营商品的电商知识图谱，更加垂直与聚焦。5个应用：内容生成、人机对话、用户意图理解、信息抽取、情感分类，涵盖零售和金融行业复用程度最高的应用场景，在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。

商汤将于4月10日发布最新进展

商汤方面宣布将在4月10日下午举办技术交流日活动，分享人工智能技术的前沿进展，据悉，这次将公布其在大模型方面的最新情况。

商汤科技方面负责人曾表示，商汤早在2021年上市时便提出“一平台四支柱”的战略定位，其中“一平台”就是指SenseCore AI大装置这一AI基础设施，它也是对于算法模型，特别是大模型开发提供重要的算力基础。

商汤SenseCore AI大装置完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力，目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练，最高可支持万亿参数超大模型的训练。商汤称，SenseCore已支持了超过10个大模型训练项目，包括语言、文生图、视觉、多模态模型。

商汤科技CEO徐立表示，商汤作为专注人工智能企业，未来首先将在大基础设施领域，为行业提供更好的算力基础赋能。在此基础上，商汤科技也将提供完整的框架，来赋能下游的行业应用。

旷视布局大模型已有4、5年时间

旷视也早已在大模型方向有所布局。据旷视科技CEO印奇介绍，大模型这个方向是确定性的。“不是因为今天热门了才做，我们已经做了有四五年的时间了。”

他说，在过去四五年时间，旷视对大模型这件事情一直非常深度follow的，而且，旷视还有很多一些原创的非常重要的大模型成果，旷视专门有个组叫foundation model，这个组只做核心的模型设计，而不是做工程化，他们有非常强的模型设计功底。

印奇表示，旷视要做万物互联的AI基础设施，“我们还是做AIoT”。“我们会提供这几件套，提供算法生成、计算平台、传感器，甚至未来会提供一个类似用模型去做的一些偏自动化编程的东西，这3-4件套就是我们的产品，我认为这套东西能把边端很多创新的部分都能够核心解决掉，接下来每个行业的合作伙伴在上面再去做更深度的应用逻辑、业务的开发。”

他也表示，旷视无论是以往的积累，还是未来，一定是非常坚定的投入，“但是我们在应用方向上也很坚定，我们还是在AIoT这么一个大环境下，我们不会去赶那个热点。”他举例说，比如像自动驾驶领域，旷视内部做了很多的研讨，ChatGPT具备很多带逻辑引擎的能力，这对实现自动驾驶未来真正的全面推广非常关键。所以旷视要把它区分，这里面有两层，Chat是上面的应用，Chat下面有个GPT3.5，应用旷视不会做，但是下面的GPT3.5核心技术能力，旷视肯定会储备。“GPT3.5大家不要觉得它只是个语言模型。什么叫语言模型？语言模型本质上就是两个最核心的部分，上面叫知识引擎，下面叫逻辑引擎，现在还没有搞的特别清楚，现在知识引擎和逻辑引擎在GPT3.5这个里面还没有完全能够分割和解构出来，但是这两个东西不光是跟对话场景相关，是跟所有场景相关。像知识引擎、AI机器人大脑要懂很多知识，也可以是垂类，也可以是泛广义类的，知识引擎如何去构建，大家可以想像的所有机器人都要用的。”

对于大模型行业的整体发展，他还表示“大家对这个表示重视总是好的，但是五六个月之后一定会有很多泡沫，会有其他企业走出来。”

科大讯飞将于5月发布认知智能大模型

科大讯飞表示，在认知智能大模型上有所布局，科大讯飞副总裁、科大讯飞研究院院长刘聪表示，讯飞基于多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程等技术方面的深厚积累，同时依托于国家新一代人工智能开放创新平台、认知智能全国重点实验室、语言及语音信息处理国家工程研究中心三大国家级平台，已具备认知智能大模型综合研发和长期持续突破的底气和能力。

他表示，认知智能大模型为人工智能技术和应用带来了重大机遇与历史意义。认知智能大模型改变了信息分发获取模式、革新了内容生产模式、在万物互联时代实现全新人机交互方式，也将为科研工作、个人工作生活辅助、编程等带来全新变革。结合讯飞持续深耕的业务赛道，认知智能大模型在智慧教育、人机交互、智慧办公、AIGC、企业数字化、工业互联网等领域可能会带来新的应用创新思考。例如在智慧教育领域，认知智能大模型可覆盖“教、学、考、评、管”的全链路场景，在学习评测、学情分析、个性化推荐等方面助力精准教学；在当下火热的AIGC领域，通过在文本、图像、音视频的创作上不断创新，认知智能大模型可以驱动AIGC的质量不断提升、成为未来内容生成的主力。

为了进一步提高大模型在细分行业的实用性，讯飞已实行了“1+N认知智能大模型”攻关计划。其中，“1”是通用认知智能大模型算法研发及高效训练底座平台，“N”则是应用于教育、医疗、人机交互、办公等多个行业领域的专用大模型版本。

刘聪介绍道，在5月6日，讯飞“1+N认知智能大模型”也将正式发布，“N”个场景的示范性应用产品也将随之呈现。“我们希望为打造中国的认知智能大模型贡献自己的力量。”

文/北京青年报记者温婧
编辑/田野