全面拥抱大模型!超过180个腾讯业务已接入腾讯混元
北京青年报客户端 2023-10-26 14:58

10月26日,腾讯宣布,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。

本次升级新增“文生图”功能,腾讯最早在广告场景进行AI自动生成图像的探索,在此过程中积累了深厚的研发能力。据介绍,相比其他大模型,腾讯混元的文生图应用,在人像真实感、场景真实感上有比较明显的优势,同时,在中国风景、动漫游戏等场景等生成上有较好的表现。

比如,输入提示词“生成可爱的亚洲 4 岁女孩穿着棉质连衣裙,大眼睛,古代中国,摄影风格,汉服”,腾讯混元大模型生成了一张图片,可以正确理解提示词中提到的“棉质连衣裙”、“汉服”等内容,同时在风格上,也通过建筑和风景等衬托,很好的展示了“古代中国”的风格要求。

再如,输入提示词“ 一个城市CBD办公楼,现代化设计,高层建筑,玻璃幕墙,近景拍摄,摄影风格,摄影照片”,腾讯混元大模型交出的作品则十分符合现实风格。或者,更简单一些,输入提示词“轻舟已过万重山,水墨画风格”就可以得到一张诗意且符合文意的图片。

据介绍,大模型文生图的难点体现在对提示词的语义理解、生成内容的合理性以及生成图片的效果。针对这三个技术难点,腾讯进行了专项的技术研究,提出了一系列原创算法,来保证生成图片的可用性和画质。 腾讯混元文生图能力,目前已经被用于素材创作、商品合成、游戏出图等多项业务中,此外在广告业务下的多轮测评中,腾讯混元文生图的案例优秀率和广告主采纳率分别达到86%和26%,均高于同类模型。

目前,超过180个腾讯内部业务已接入腾讯混元,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。最近,QQ浏览器还基于腾讯混元推出了“PDF阅读助手”,具备智能摘要、智能问答和多轮提问等功能。

大模型还可以用来写代码。腾讯内部目前已经有多个开发平台接入了腾讯混元大模型,工程师们可以使用腾讯混元来进行代码生成、代码补全、代码漏洞检测和修复、表格数据处理、数据库查询等工作。

目前,已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户,通过腾讯云调用腾讯混元大模型API,应用领域涉及智能问答、内容创作、数据分析、代码助手等多个场景。今年9月首批通过备案后,腾讯混元大模型也已经面向C端用户陆续开放体验,用户通过小程序或网页端,就能与腾讯混元对话。

文/北京青年报记者 温婧
编辑/樊宏伟

最新评论