字节Seedream 3.0追平GPT-4o入文生图第一梯队!即梦、豆包全量上线
北京青年报客户端 2025-04-20 16:24

近日,文生图领域权威的第三方榜单Artificial Analysis竞技场发布消息称,字节跳动Seed团队图像生成模型Seedream 3.0综合性能已追平文生图SOTA模型GPT-4o,稳定超越Recraft V3、Ideogram、Imagen 3、Midjourney V6.1等模型,进入全球第一梯队。

Seedream 3.0是字节近日发布的新一代文生图主力模型,目前已在即梦、豆包等平台全量开放。据Seedream 3.0技术报告,Seedream3.0是一个原生高分辨率、支持中英双语的图像生成基础模型,无需后处理即可实现 2K 分辨率图像直出,适配多比例场景,同时针对小字体高保真生成、多行文本排版等业界难题,模型也取得了突破性的效果表现。

值得一提的是,Seedream 3.0在3秒左右即可快速生成1K分辨率的高品质内容,相比之下,业界同类模型生成该分辨率内容的耗时基本在10秒以上,而此前文生图SOTA模型GPT-4o平均耗时为77秒。

Seedream3.0还大幅提升了小字体高保真生成、多行文本语义排版表现,满足设计师对海报设计的需求。团队在预训练阶段,引入跨模态旋转位置编码,补足传统方法模态特征对齐短板,进一步加强了文字渲染能力。

Seedream团队表示,“新模型在海报创作、生成效率、结构与美感等方面取得了明显进步,但在生成可用性、美感与结构、智能化方面仍有提升空间。”

文/北京青年报记者 温婧
编辑/贺梦禹

相关阅读
豆包针对企业市场深度思考模型发布,具备“看图思考”能力
北京青年报客户端 2025-04-17
MiniMax加入视频生成混战 大模型的尽头是做视频?
第一财经 2024-09-02
OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能
澎湃新闻 2024-06-21
新闻调查|从GPT-4o看人工智能竞争的走向和挑战
新华社 2024-05-31
解读|GPT-4o为OpenAI开启超级入口 对谷歌形成挑战?
北京青年报客户端 2024-05-19
极越01纯视觉高阶智驾站稳第一梯队 V1.4.0升级OCC 3D地图可视化效果
北京青年报客户端 2024-03-26
加入文生视频战局! OpenAI将Sora视作“世界模拟器”
第一财经 2024-02-16
加入文生视频战局!OpenAI将Sora视作“世界模拟器”
第一财经 2024-02-16
最新评论