豆包针对企业市场深度思考模型发布,具备“看图思考”能力
北京青年报客户端 2025-04-17 19:20

4月17日,火山引擎面向企业市场发布豆包1.5・深度思考模型,同步升级文生图模型3.0、视觉理解模型。同时推出OS Agent解决方案及AI云原生推理套件,帮助企业更快、更省地构建和部署Agent应用。

据火山引擎披露,截至2025 年3 月底,豆包大模型日均tokens 调用量已达到12.7万亿,较去年5月发布时增长上百倍。火山引擎总裁谭待表示,Agent智能体应用发展将带动大模型进一步普及。谭待说:“深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。”

据谭待介绍,豆包1.5・深度思考模型在专业领域的推理任务中表现出色,在数学推理、编程竞赛和科学推理方面表现接近目前最先进的大模型。在创意写作、人文知识问答等通用任务上,模型也展示出优秀的泛化能力,能胜任更广泛的使用场景。

豆包深度思考模型还具备视觉推理能力,能像人类一样对看到的事物进行联想和思考,极大拓展了智能推理的应用边界。谭待举例说明,“模型可以看懂复杂的企业项目管理流程图表,快速定位到关键信息,并以强大的指令遵循能力,严格按照流程图,回答客户的问题;分析航拍图时,能结合地貌特征判断区域开发可行性。有多模态能力的加持,豆包深度思考模型可以助力企业在更多场景实现智能化升级。”

此外,豆包文生图模型Seedream3.0也正式向企业开放。Seedream3.0支持2K分辨率直出,生图结构准确性、小字生成与排版、美感、真实度等方面具有优势。

技术报告显示,豆包深度思考模型采用MoE架构,总参数为200B,激活参数仅20B,以较小参数实现媲美顶尖模型的效果。基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。

2025年被业界视为“Agent智能体元年”。 为此,火山引擎宣布推出OS Agent解决方案,并演示了由Agent操作浏览器,搜索商品页,实现iPhone比价的任务,甚至由Agent在远程计算机上用剪映进行视频编辑、配乐。

此外,面对大规模推理需求,火山引擎专门打造了AI云原生ServingKit推理套件,让模型部署更快、推理成本更低,GPU消耗相比传统方案降低80%。

文/北京青年报记者 温婧
编辑/李涛

相关阅读
奔驰新款CLA接入豆包大模型
北京青年报客户端 2025-04-24
火山引擎发布企业数据智能体Data Agent
北京青年报客户端 2025-04-09
豆包测试新版深度思考功能 支持边想边搜
北京青年报客户端 2025-03-28
与火山引擎达成重磅合作!涂鸦智能2024年扭亏为盈
证券时报网 2025-03-01
AI大模型 从重投入转向重产出
上海证券报 2025-01-08
联想与火山引擎官宣合作,为AI桌面助手接入豆包大模型
北京青年报客户端 2024-12-29
字节系大模型比同行便宜八成?火山引擎总裁:市场需要充分竞争,做得最好才能活下来
澎湃新闻 2024-12-19
群雄争霸多模态大模型
21世纪经济报道 2024-12-19
最新评论