
今天,在FORCE原动力大会上,火山引擎正式发布豆包大模型1.6、豆包·视频生成模型Seedance1.0pro、豆包·语音播客模型,豆包·实时语音模型在火山引擎全量上线,豆包大模型家族已成为拥有全模态、全尺寸、高性价比的领先模型。截至2025年5月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月刚发布时增长137倍。
字节跳动CEO梁汝波表示,做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。
字节跳动CEO 梁汝波
在价格方面,豆包大模型1.6采用统一定价模式,按“输入长度”区间定价,在企业使用最多的输入区间0-32K范围内,豆包大模型1.6的价格为输入0.8元/百万tokens、输出8元/百万tokens,综合成本比豆包1.5·深度思考模型、DeepSeekR1降低63%。Seedance1.0 pro 模型每千tokens0.015元,相当于每生成一条5秒的1080P视频只需3.67元,行业最低。
目前,能自主思考、规划、完成任务的Agent正在逐步进入企业生产场景,这不仅需要模型做到强推理、多模态、低成本,也需要升级AI云原生全栈服务。大会上,字节跳动技术副总裁洪定坤、火山引擎总裁谭待发布了12款面向Agent开发和应用的工具产品。
针对Agent开发,升级AIIDE“TRAE”,发布火山引擎MCP服务、Prompt优化工具“PromptPilot”、开源的veRL强化学习框架、AI知识管理产品;大数据服务上,发布多模态数据湖、AI数字专家“DataAgent”;AI基础设施上,针对Agent开发、模型训练和推理,发布AgentKit、TrainingKit、Servingkit;安全是一切Agent运行的基础,为此火山引擎发布AICC私密计算、大模型应用防火墙。
谭待表示,AI时代,开发范式、大数据、计算、安全都在发生重大变化,由此构成的“AI云原生”全新技术栈,是企业构建好Agent、创新发展的关键。
火山引擎总裁谭待
豆包大模型1.6正式发布更强模型 更高性价比
全新发布的豆包大模型1.6系列由三个模型组成,为企业提供多样化选择。
doubao-seed-1.6:All-in-One的综合模型,是国内首个支持256K上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少tokens消耗。
doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的强化版本;在代码、数学、逻辑推理等基础能力上进一步提升;支持256K上下文。
doubao-seed-1.6-flash:豆包大模型1.6系列的极速版本,支持深度思考、多模态理解、256K上下文;延迟极低,TOPT仅需10ms;视觉理解能力比肩友商旗舰模型。
豆包大模型1.6具有更强的模型效果,在众多权威测评集上,得分均属于国际第一梯队。在推理能力、多模态理解能力、GUI操作能力上具备领先优势。
推理能力 豆包大模型1.6在推理速度、准确度与稳定性上显著提升,可支撑更复杂的业务场景落地。
例如,有媒体针对今年的高考全国新一卷数学单科做了测评,豆包的成绩是144分,全国第一。而在高考前,在针对海淀区模拟全卷的测评中,相比去年的模型,豆包大模型1.6理科成绩显著提升了154分,文科提升了90分。
豆包大模型1.6具有边想边搜、DeepResearch深度研究能力,能独立思考、规划、使用搜索等各种研究工具。例如豆包APP和PC端正在小流量测试的DeepResearch功能,可以把过去需要多名专业人士花费数天写成的调研报告,缩短到5-30分钟内完成,还能自动提炼信息,总结成网页,方便查阅。
为方便企业使用“边想边搜”和DeepResearch功能,火山引擎打造了大模型应用实验室,并开源了手机助手、实时视频理解、DeepSearch等应用,帮助企业快速搭建AI应用原型,灵活编排自己的专属智能体。用户可在火山引擎官网大模型应用实验室、GitHub方舟开源站点下载使用。
多模态理解
多模态理解的核心是“让模型像人一样理解世界”。豆包大模型1.6全系列均原生支持多模态思考能力,让模型可以理解和处理真实世界的问题。该能力支持了豆包APP最新的实时视频通话功能,在企业端可广泛应用于电商商品审核、自动驾驶标注、安全巡检等场景。
GUI操作能力
豆包大模型1.6凭借领先的视觉深度思考能力、精准的视觉定位能力,能够让智能体与浏览器及其他软件进行交互和操作,高效执行各类任务。
更高性价比
豆包大模型1.6采用统一定价模式,无论是否开启深度思考模式,无论是文本还是视觉,tokens价格均一致,按照输入上下文长度区间定价。
在绝大部分企业使用的输入区间0-32K范围内,价格是输入0.8元/百万tokens,输出8元/百万tokens
在输入区间32K-128K的范围内,价格是输入1.2元/百万tokens,输出16元/百万tokens
在输入区间128K-256K的范围内,价格是输入2.4元/百万tokens,输出24元/百万tokens
从综合成本来看,绝大部分请求输入都在32K以内,输入输出占比在3:1,豆包大模型1.6的综合成本(2.6元)比豆包大模型1.5·深度思考模型、DeepSeekR1的综合成本(7元)下降63%,相当于只需原来三分之一的价格,就能使用能力更强、原生多模态的新模型。
此次火山引擎还增设特惠区,对于输入32K、输出200tokens 以内的请求,豆包大模型1.6的价格将进一步降低到输入0.8元/百万tokens、输出2元/百万tokens。相当于绝大部分非思考模型的需求,也可以安心使用更好效果的新模型。
豆包·视频生成模型 Seedance1.0 pro正式发布
全新发布的豆包·视频生成模型Seedance1.0 pro 具备三大特性:无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感,在电商、影视、游戏等行业应用前景广阔。
根据第三方权威榜单ArtificialAnalysis最新结果,Seedance1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一。
Seedance1.0 pro 的价格是每千tokens1分5厘,相当于每生成一条5秒的1080P视频只需3.67元。假如有1万元预算,通过Seedance1.0Pro 可制作2,700多条5秒的1080P视频,通过Seedance1.0 lite 可以制作9,700多条视频。
两款豆包语音大模型上新
语音正在成为AI 应用和Agent的核心交互方式,小米汽车、OPPO、美图、儿歌多多等企业已使用豆包语音大模型提升产品创新体验。
今天,豆包·实时语音模型全量上线火山方舟,对企业客户开放使用。该模型支持自然语言高级指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,语气、用语、思考方式等拟人感大幅提升,能随时打断与主动搭话。
此外,火山引擎还发布了豆包·语音播客模型。只需输入一句话、网页链接、长文本或文档,语音播客模型即可快速搜索学习,生成播客脚本后创作出来;模型可秒级生成双人对话式播客作品,效果自然,具有互相附和、插话、犹豫等播客节奏;自带的深度搜索功能可生成跟进热点话题的播客内容。
AI云原生全栈服务发布让Agent从Demo走进企业生产系统
AI时代,开发范式将发生重大变化,调用中心正在从程序员转移到大模型,这就需要更好的模型和模型工具平台。在基础设施层,计算(以GPU为核心的计算和网络系统)、大数据(多模态)、安全(防御恶意AI)也正在发生巨变。为此,火山引擎发布AI云原生全栈服务,帮助企业加速Agent 落地。
Agent开发用好AI+做好AI
火山引擎智能算法负责人吴迪表示,要构建高生产力的Agent,既要用好AI,整合高质量的应用;又要做好AI,关注底层技术本身的优化和创新。
为帮助企业高效构建Agent,此次火山引擎发布和升级了五款产品:
AIIDE产品TRAE升级:为开发者提供代码补全、局部代码生成功能,支持代码重构、批量修改、知识问答等复杂任务,下一个版本还将整合不同Agent和工具,协调任务流程,实现自动串联操作,逐步从AI辅助编程向支持AI开发全流程进阶。今年1月上线至今,TRAE月活用户已经超过了100万。
发布火山引擎MCP服务:链接Agent开发体系、大模型工具生态、云服务。与TRAE、火山方舟、扣子打通,一键选择200+丰富MCP服务;开发者可以通过MCP,控制火山引擎的云服务组件,便捷地完成计算、网络、存储等环境部署,更快地把一个创意,变成一个成熟的产品。
发布PromptPilot:可以帮助开发者把模糊的诉求变为具象化的目标,在互动中引导用户明确需求、理想回答和评估标准;自动撰写和优化提示词;产生badcase能自动优化提示词,实现精准调控;具备多轮对话、视觉理解、复杂工具调用的优化能力,以及自主判断是否开启模型精调等。
发布AI知识管理产品:支持文本、图像、音频、视频等多模态内容对话式交互,融合本地与互联网知识,提供内容理解和问答服务;首创可交互的推理“做个计划”功能,实现人机协作制定、修改计划。目前已在火山引擎全量邀测。
发布开源的veRL强化学习框架:可轻松扩展多种强化学习算法,无缝集成现有LLM基础设施与模块化API,助力开发者快速搭建RL模型开发管线,提升对话规划、智能编程、复杂策略优化等场景的开发效率与资源利用率。除了提供开源框架,此次还上线了veRL平台,用充沛的算力支持强化学习需求。
数据从支持BI到支持AI
AI时代,数据基础设施的价值已从“支持 BI”迈向“支持 AI”。火山引擎发布多模态数据湖解决方案、DataAgent,助力企业构建智能化、可感知、可行动的数据体系,实现数据的“主动思考”,让数据真正成为企业的智慧大脑”。
多模态数据湖:新一代AINative 的数据基建,帮助企业在多模态数据处理、检索和分析场景上,更快、更好地识别和利用多模态数据资产,成为驱动企业AI模型训练与决策的核心设施。
DataAgent:新一代企业级AI数字专家,具备数据主动分析、智能洞察、策略生成能力;可将日常取数速度从小时级到分钟级,数据获取成本降低80%;复杂分析效率从周级到小时级,洞察及时性提升90%;深度分析报告及营销方案的产出时间和人力成本都能大幅节省。
AI基础设施更强、更易用、更开放的AIInfra
火山引擎AI infra提供性能和功能更强大、使用更简易的Agent套件、推理套件、训练套件,帮助企业全链路加速Agent 构建。
AgentKit:为企业级Agent打造的全栈开发和服务工具链,集成豆包大模型1.6与ComputerUse等工具;基于火山引擎veFaaS预置模板,用户只需选择模型和配置参数即可快速部署,可实现分钟级10万核扩容;构建完整工具生态体系,支持多终端ToolUse、覆盖数十类三方MCPServer。
云原生训练套件TrainingKit:实现高达60%+的MFU(算力利用率);面向后训练环节,通过veRL 框架、Sandbox百万核秒并发能力,有效提升后训练效率,为AI训练全流程筑牢技术底座。
云原生推理套件ServingKit:从模型部署、在线推理、服务运维三个阶段进行加速和提效,支持开源推理框架,并针对主流模型进行算子优化,性能相比社区最新版本可以提升2-3倍;已在互联网、物流、汽车等各行业应用,提升模型训推效率,降低成本。
安全一切Agent运行的基础针对企业数据和用户隐私保护,如何防止恶意攻击等安全挑战,火山引擎发布两款AI安全产品,目前已在联想、中国银联、长安汽车等众多企业落地。
AICC密态计算:通过用户个人密钥加密、CPU/GPU硬件可信环境计算、数据流转落盘全密文的方式,在不损失推理效果的前提下,让企业像使用私部模型一样安全合规的使用云端模型。
大模型应用防火墙:通过精调的小参数模型、分层漏斗策略、流式送检机制,保障精准拦截攻击变种,同时不会增加推理延迟,为企业智能体应用构建安全可信的大模型推理空间。