摘要:火山引擎FORCE大会第二天聚焦企业AI落地,提出从单一模型到多模型协同、从Agent到数字员工的体系化方案。本文提炼三大核心挑战与对应解法,梳理豆包大模型家族升级、AI云基础设施全面进化,以及TRAEWORK、扣子3.0、HiAgent 3.0组成的产品矩阵。适合关注企业AI落地的技术管理者。
目录
- 企业AI落地的三大挑战
- 火山引擎的AI云原生解法
- 豆包大模型2.1系列能力升级
- 视频图像模型CG 5.0 Pro与Cdance 2.5
- AI云基础设施全面升级
- 产品矩阵:TRAEWORK、扣子3.0、HiAgent 3.0
- 行业实践:从电视到金融的AI落地
- 参考资源
1. 企业AI落地的三大挑战
火山引擎总裁谭代在演讲中直接点出当前企业AI落地的核心困境:模型越来越聪明,但落地依然困难。他归纳为三个具体挑战:
| 挑战 | 描述 | 本质 |
|---|---|---|
| 复杂业务需多模型协同 | 企业问题不是静态问答,而是动态任务,涉及数据、系统联动、多步骤分析 | 单一模型能力不足 |
| 从模型到Agent缺企业级能力 | 好模型像好毕业生,上岗前需培训;Agent需要身份权限、数据连接、评测治理才能进入生产 | 缺少中间层基础设施 |
| 多Agent难形成组织合力 | 多个Agent如何协同、沉淀经验、量化价值 | 缺少运营治理体系 |
这里谭代举了个很接地气的例子:销售拜访客户,看似简单,背后涉及客户画像、实时信息、系统联动、多步骤分析。这种场景不是问一个问题能解决的,需要端到端的编排和执行。
2. 火山引擎的AI云原生解法
火山引擎以模型为核心,构建三层AI云原生架构:
| 层级 | 能力 | 对应产品 |
|---|---|---|
| 模型层 | 多模型协同、全模态覆盖 | 豆包大模型家族 + 火山方舟 |
| Agent层 | 身份、权限、运行时、沙箱、评测、记忆 | AgentKit |
| 运营层 | 全局监控、治理、度量 | 数字员工管理体系 |
企业级Agent三原则:
- 可靠:稳定运行长程复杂任务
- 可控:明确边界,关键节点需人工确认
- 可衡量:AI投入需要看到可量化的价值
这三原则说实话并不新鲜,但难的是如何落地。AgentKit做的其实就是把这三原则拆解成具体的工程模块,让企业不用从零开始造轮子。
3. 豆包大模型2.1系列能力升级
吴迪(火山引擎智能算法负责人)重点介绍了C 2.1模型在Agent方向的升级:
C 2.1核心能力:
- 更强的任务理解与长期规划
- 更好的错误应对与工程交付质量
- 视觉理解能力增强:图像视频细颗粒度理解、UI操作稳定性提升
典型应用场景:
- 游戏开发:2D卡通闯关游戏全流程——方案规划、Prompt撰写、切帧抠图、Bug修复、Godot引擎交付,由工程师独立完成
- 设计稿转网站:平面户型图→三维场景、数据看板草图→像素级还原网站
- 创意工作室官网录屏理解→独立运行网站
关键判断:吴迪提出2026年三个趋势——语言模型成为数字世界底层引擎、视频图像持续突破、企业级复杂Agent逐渐成熟。异步长程任务将更广泛渗透到企业生产经营中。
🤔这几个趋势判断其实挺保守的,尤其是异步长程任务——如果Agent能稳定跑几小时甚至几天,那很多需要人盯着的流程都可以交给它了。
4. 视频图像模型CG 5.0 Pro与Cdance 2.5
CG 5.0 Pro图像模型(7月发布):
- 交互式精准编辑:在画面上点选圈选,用箭头或草图表达编辑意图
- 多图层分离:画面元素拆成有序图层,逐层编辑精修
- 更高密度内容表达:复杂数据、流程、图文结构化组织进一张图
- 多语种文字生成:一键生成多语言版本
Cdance 2.5视频模型四大升级:
- 更长视频:单条30秒直出,全球领先
- 更丰富参考输入:多参考素材联合生成
- 更精准编辑:年龄变化、风格迁移(如侠客水墨风格转化)
- 更广泛语言覆盖:原生支持十几种语言
一个值得注意的变化:视频创作门槛在急速降低。例如于聪里的画家作品,作者接触AI创作不到半年,两天左右把故事变成画面,全网播放突破7000万。他用的Prompt就是一个故事,不是一堆镜头参数——这意味着创作正在回归表达本身,普通人也能讲出好故事。
5. AI云基础设施全面升级
田涛涛(火山引擎云基础产品负责人)介绍了面向Agent的云基础设施升级:
计算能力:
- 第三代资源池:网络带宽360 Gbps(提升100%),PPS 6800万(提升42%),端到端延时低至56微秒
- 第四代大数据服务器:单核能力提升40%
- 分钟级拉起12万容器化能力
网络能力:
- 全网关:就近接入全球网络,结合CloudWAN自动组网
- PrivateLink跨地域访问:一处发布,全网可达
- NAT网关七层代理转发:Agent访问公网可控可审计
存储与数据库:
- BS沙箱存储:万级云盘并发创建
- 弹性远程盘:单盘吞吐超4GB/秒
- OpenVI上下文管理数据库:专为AI设计,已集成至OpenCloud、OpenCode等生态
- 企业知识中心:可信、合规、可执行的知识接入方案
身份与安全:
- Identity支持飞书、钉钉、企微及自定义OAuth接入
- Agent遵循最小权限原则,不能简单继承用户全部权限
- 个人Agent遵循个人授权边界,团队Agent遵循workspace隔离,企业Agent支持审批访问全审计
身份权限这块其实很关键。很多企业不敢让Agent进核心系统,就是怕它权限过大。最小权限原则听起来简单,但在实际企业环境里落地需要一整套基础设施支撑。
6. 产品矩阵:TRAEWORK、扣子3.0、HiAgent 3.0
张鑫(火山引擎副总裁)发布面向不同角色的产品矩阵:
| 产品 | 目标用户 | 核心价值 |
|---|---|---|
| TRAEWORK | 研发团队 | AI办公工作台,Code+Work双模式 |
| 扣子3.0 | 业务团队 | 多人多Agent协同,三端协同 |
| HiAgent 3.0 | IT和管理者 | 数字员工全生命周期管理 |
TRAEWORK:
- Work模式:文档撰写、数据分析等日常办公
- Code模式:快速原型开发,支持自然语言开发
- 一个账号轻松切换,一个后台统一管理
- 核心理念从代码优先转向Spec First(规范优先)
扣子3.0:
- 多人多Agent灵活组合,随时拉起AI团队
- 移动端、网页端、PC端三端协同
- 行业知识沉淀:金融、法律、医疗等领域专业能力接入
- 广发证券案例:财务对比、ETF筛选、龙虎榜等能力形成标准化LLM
HiAgent 3.0:
- 开发域:从写代码转向定义目标组合能力
- 运行域:自主+编排双态引擎
- 管理域:数字员工效能大盘,四张可量化榜单(全局概览、业务产出、产物评分、核算)
- 汽车经销商案例:4周工作缩至5天,效率提升3.5倍
三个产品分别面向研发、业务、管理三个群体,但底层数据和能力是打通的。这种矩阵式打法其实挺符合企业实际情况,但最终要形成统一的数据流和治理体系。
7. 行业实践:从电视到金融的AI落地
创维酷开:AI重构大屏价值
- AI播客产品上线后,新闻模块活跃率提升5倍以上
- UI全部后端生成,功能上线从2周缩至2-3天
- 康养智能体:健康管理+陪诊住行服务闭环
- 核心思路:把复杂留给云端,把简单留给用户
民生银行:金融AI Agent实践
- 沈志勇(民生银行)分享银行三个环境对Agent的不同要求:
- 生产环境:追求高确定性、高可控性
- 办公环境:文案处理、专业判断,最后需人把关
- 开发环境:软件工程是AI被证明有效的主要领域
- C端能力不能简单迁移到B端,B端更强调可靠性、安全性、易审计性
- 神经符号混合架构:用神经网络带来灵活性,符号逻辑带来确定性
- Skill形成能力封装,就像传统软件的内部库
🕶️沈志勇那段关于Attention Is All You Need的吐槽挺有意思:当你相信Attention是万能的,就得接受它只是在找相似的东西。幻觉和跨域关联困难是Attention的天然缺陷,解决方案是在外面加逻辑护栏,做跨域连接。这种神经符号混合的思路其实比单纯堆模型参数更务实。
8. 最后
个人感觉,相比第一天的新品发布,第二天更像是一场坦白局。谭代那段讲企业AI落地三大挑战的时候,我能想到很多做过AI项目的朋友会频频点头:模型变聪明了,但业务里还是用不起来,这确实是真实困境。希望以上内容对你有帮助!
- 本文基于B站视频@AI开讲啦《2026火山引擎Force原动力大会 主会场(第二天上午)》,由音视频转录工具Ai好记进行文稿转录、思维导图梳理、精华要点提取。如果你也有音视频学习习惯,可以试试用这个工具把高价值视频转为图文笔记进行存储后深度学习,省时省力,亲测好用!
如有问题欢迎评论区交流。如果本文对你有帮助,点赞、收藏、转发支持~