凤凰彩票「中国」有限公司 百度智能云 DuMate 测评:办公 Agent 教我用 Claude Code,后果如何?
雷峰网讯 百度针对企业级场景想象的桌面级 AI 智能体 DuMate 于本年 3 月 22 日全量上线。从咱们关于 AI 办公居品的以往测评来看,能够简直参加办公场景的居品照旧未几见。
DuMate 能否防碍中看不顶用的魔咒,成为一款简直能“抗活儿”的 AI 搭子?带着这么的疑问,咱们想象了一项隐敝技俩谈论、收场整理以及包括四种托福物的多形态输出任务。望望百度智能云 DuMate,究竟能把任务推动到什么程度。

先看居品逻辑:措置简直责任流问题
中国一众 AI 玩家里,百度的打法一直有我方的逻辑。文心一言打头部贯通商场,秒哒打无代码诳骗搭建,而 DuMate 则试图填补一个更具体的位置,个东说念主及团队的往常办公场景中,简直替代那些需要“操作软件、串联文献、托福收场”的访佛就业。
本体上,这即是桌面级 Agent 的生态位。AI 助手的价值,不在于“答得更好”,更在于“作念得更多”。当大模子的推颖悟力逐渐同质化,简直拉开差距的,是谁能更好地把 AI 镶嵌简直责任流,并托福可留存、可复用的收场。
左证百度智能云公开辛勤,DuMate 强调的不仅仅问答,而是“看见屏幕、操作软件、处理文献、串联业务系统”。看起来浅近的功能定位,推行上隐敝了从桌面实践、责任区、手段膨大到土产货安全、办公托福的整条责任链。在技艺逻辑上,这需要 DuMate 具备三个档次的智力。
第一层是感知与领路。DuMate 需要领路用户在说什么、想作念什么,这背后是将天然话语提醒映射为具体操作序列的智力。
第二层是器具调用与实践,领路之后,DuMate 需要调起正确的器具,读写文献、操作浏览器、实践代码、调用 API。这条目它对桌面环境有简直的感知和限定智力,而非只复返一个 API 调用建议。
终末即是收场托福与存档。实践完成后,收场需要以正确的形态输出,关于办公助手来说,这时时是 Word 文档、Excel 表格、PPT 演示或者网站页面。而且托福物本人必须可留存、可复用。
本年 3 月 22 日全量上线后,DuMate 赶紧补皆了手段广场、Word/PPT/Excel 优化、文献预览领会、逐日回归、音书渠说念接入和负责计费等智力。在不到一个月的时辰内,中枢办公智力如故基本无缺。DuMate 办公责任台的居品逻辑如故越发显著:即通过一个智能体,将用户暧昧的见识,平直出动为可留存、可复用的最终托福物,从而简直镶嵌并措置简直的责任流问题。
实测:一套事实底稿,四种托福物
此次测试,咱们莫得聘任常见的“写一篇著作”或“整理一份表格”之类不痛不痒的轻任务,而是给 DuMate 叮嘱了一项更接近简直责任的复杂任务,围绕某一个 GitHub 技俩,完成一次“技俩谈论 + 多形态托福”任务。
比如让 AI 作念一张 excel 或者生成一张 PPT,这类任务太浅近、太干净,现实中很少有东说念主这么责任,根柢测不出来 AI 的水平。关联词用一个简直的、杂沓的、多源信息的任务来考查 AI,比如围绕一个 GitHub 技俩作念任务,这正是研发、居品、技艺写稿主说念主员往常会际遇的责任。要是 AI 在这种任务上施展可以,那它在简直办公场景中大约率也能派上用场。
此次咱们聘任的 GitHub 技俩叫作念 everything-claude-code,给不熟谙的一又友先容一下。这个技俩在 GitHub 上的 Star 数如故逾越了 14 万。比起某种器具,它更像是一套专为 Claude Code 等 AI 编程器具想象的工程化设立系统,既能用来调教 AI,也能拿它学习如何跟 AI 打合作。
Everything-claude-code 被想象出来的目的即是把 AI 从“聊天佑手”升级成可辞退法式、千里淀训戒的智能工程系统。
具体来说它措置的是四大痛点:
抓久化牵挂:通过自动化钩子杀青跨会话高下文保存,幸免换技俩就失忆;
法式化进程:将确立拆解为绸缪、审查、测试等枢纽;
自动化检查:内置安全扫描器具 AgentShield,含 1282 项测试和 102 条安全规则;
抓续学习:AI 自动索要有用模式千里淀为团队学问。
所有这个词技俩组件像一个无缺的“ AI 确立活水线”,包括 30 多个各司其职的 Agent,150+ 个可复用 Skill 固化成的最好实践,70+ 条快捷敕令一键触发复杂进程,还有 30 余条规则组成 AI 的活动底线。
浅近来说,everything-claude-code 即是将一位资深工程师的一次性对话变成了可积聚、可优化的“工程实践”,况兼能平直服务于你的私东说念主 Agent 助理。
咱们为 DuMate 想象的测试任务,即是条目它对开源在 GitHub 上的 everything-claude-code 进行整理,并把这份“阴私”以 Excel 内容目次、Word 说明书、PPT 大纲与逐页内容、网站四种款式进行输出。
测试题目:
代码块
请围绕 GitHub 技俩 everything-claude-code(https://github.com/affaan-m/everything-claude-code)完成一次“技俩谈论 + 多形态托福”任务。
从容:该技俩不是庸俗诳骗,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统。请重心分析其 commands、skills、hooks、rules、guides、install scripts、设立与集成形态,不要误写成传统 SaaS 或单体软件。
请你先基于 GitHub 仓库和公开汇集辛勤完成谈论,火狐体育中国官网入口酿成一份“息争事实底稿”,再基于这归并套事实底稿输出以下 4 项托福物:
1. 一份可存档的负责 Word 说明书 , 以筹划机类专科竹素的款式呈现
2. 一份相宜先容 / 陈说的 PPT 内容稿,面向筹划机专科群体
3. 一个可土产货预览的展示型静态网站
4. 一份 Excel 统计表,用于统计现时技俩的组件 / 模块 / 目次 / 重要文献数目、称号、作用说明及备注
一、谈论领域
至少隐敝:
- 技俩定位、见识用户、措置的问题、典型场景
- commands / skills / hooks / rules / guides / scripts / 设立文献 / tests / integrations 的结构与作用
- 装配、设立、接入形态、典型用法
- 架构或责任机制
- 现时版块气象、最近更新、保侍奉跃度
- 风险、限制、不笃定项
- GitHub 除外的 guide、release、官网、文档、博客、社区、教程、讨论等辛勤
二、息争事实底稿
请先输出一份结构化技俩谍报,算作后续全部托福物的唯独事实起原。
条目:
- 先输出“息争事实底稿”,标注【已阐发】【料想】【待阐发】,尽量附起原诱骗
- 如有辛勤冲突,列出冲突点与判断依据
- 统统后续托福物必须严格基于归并套事实底稿,彼此不得矛盾
- 不得假造技俩中不存在的功能、组件、版块或官方信息
三、托福物条目
1)Word:面向初度构兵者,章节无缺、专科负责,相宜存档 / 培训 / 对外说明;若不可平直生成 .docx,则提供无缺正文、标题层级、封面建议、排版建议和文献名
2)PPT:相宜先容 / 陈说,不照搬说明书;先大纲后逐页;每页含标题、3-6 个要点、图示建议、演讲备注;10-18 页;若不可平直生成 .pptx,则提供无缺逐页内容和文献名
3)网站:若不可平直发布,则生资土产货可开动的静态网站目次;至少包含首页、技俩先容、中枢智力、装配使用、架构说明、FAQ、参考辛勤;提供目次结构、全部文献内容、进口文献名和通达要领;优先使用无需复杂构建的 HTML/CSS/JS
4)Excel:先说明统计口径;统计现时技俩的目次、commands、skills、hooks、rules、scripts、docs/guides、设立文献、tests、integration targets 等数目、称号、旅途、作用说明、所属类别、备注、起原依据;若不可平直生成 .xlsx,则提供可平直导入 Excel 的 CSV 或表格内容及文献名
四、输出公法
1. 谈论要领与信息起原
2. 息争事实底稿
3. Excel 统计口径与统计表
4. Word 说明书
5. PPT 大纲与逐页内容
2026世界杯竞猜中国官网6. 网站目次结构与文献内容
7. 风险说明、未阐发项、受限项
8. 最终托福清单与建议文献名
五、全局不断
- 统统产出必须基于归并套事实底稿,彼此不得矛盾
- 不得假造 GitHub 仓库中不存在的功能、组件、版块或官方信息
- 对不笃定内容必须明确标注
- 不得在无法生成简直 .docx/.pptx/.xlsx 文献时谎称“已生成完成”
这项任务的难点在于,everything-claude-code 不是庸俗诳骗圭臬,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统,因此 DuMate 不可把它误写成传统 SaaS 或单体软件。
此外由于超高的热度,everything-claude-code 在汇集上有多数公开辛勤补充,DuMate 的谈论不可局限于 GitHub 仓库。良莠不皆的公开辛勤又对托福质料建议了挑战,即统统内容必须基于归并套”息争事实底稿”,DuMate 需要甄别、放弃那些首尾乖互的造作信息。
最终,它需要托福四样东西:一份 Word 说明书、一份 PPT 内容稿、一个可土产货预览的静态网站,以及一份 Excel 统计表。
DuMate 的施展如何呢?底下来望望:
搭底稿:先谈论,后输出
第一步,DuMate 先读懂 everything-claude-code 技俩,并从公开汇集补充 guide、release、文档、博客和社区辛勤,凤凰彩票「中国」有限公司最终酿成“息争事实底稿”。这一步最值得看的,不光是它会不会把仓库 README 摘一遍,还有它有莫得智力把仓库内信息和仓库外信息合并起来,再组织成后续托福物共同依赖的底层材料。
从推行界面看,DuMate 莫得停留在“对话框里给一段回归”,而是把任务拆成了多个阶段节点。右侧“进度”栏会炫耀现时正在生成的 Word、PPT、网站目次与最终清单等内容,左侧则能看到现时对话与责任区文献。这意味着它的实践过程不是黑箱,用户能知说念它正在作念什么、哪些文献如故生成、后续还会走到哪一步。对一款以“真干活”为卖点的办公 Agent 来说,可不雅察、可控的使用体验是必不可少的。

更重要的是,DuMate 先搭底稿,再作念输出。这个动作的价值在于:一朝底稿成型,背面的 Word、PPT、网站和 Excel 才有可能保抓前后一致。对有过简直技俩经验的东说念主来说,最耗东说念主的时时不是写材料,而是来去查对材料之间是否矛盾。DuMate 施展出来的,是一种更接近技俩责任的谈论先行 + 一稿多用想路。


Excel 统计:统计口径先行
在事实底稿之后,DuMate 被条目生成 Excel 统计表。这里的难点不是“作念个表”,而是要明确统计口径,梳理技俩模块、目次、重要文献、数目、旅途、作用说明和备注,况兼与前边的谈论论断保抓一致。
推行任务中,它给出的不是一张临时列表,而是一份更接近可二次使用的统计材料,包含统计口径说明、各字段界说,以及能够与后续文档交叉查对的结构化数据。

Word 说明书:参加简直文献生成进程
接着是 Word 说明书。这一步更像托福考据,庸俗聊天佑手时时只可给你一段“可以复制到 Word 里”的正文,而 DuMate 则参加了简直文献生成进程,终末平直拿出一个可以平直预览的 .docx 文档。
用户看到的不再是“文本建议”,而是一个如故生成出来、可以连续流转和保存的文献。这其中的差距,远比听上去的大。

到这一步,托福物如故展现出了不俗的落地价值。everything-claude-code 本人即是极具共享价值的实践训戒,在此基础上酿成的技艺说明书,更是把这份“大牛指南”掰开揉碎了喂给用户。架构想象和中枢组件先容都是最基本的,这份 35 页的文档里,一半以上都是可以平直引导 Agent 实践的部署教程和最好实践案例。就连高频出现的问题,都整理成了一份故障放弃指南。

PPT + 网站:内容形态切换
PPT 的呈现后果也可以。事实上这个枢纽的难点从来不在于把文档压缩到几个画面上,而是要让内容从书面阐明切换到视觉抒发。DuMate 在这一枢纽连续沿用归并套事实底稿,莫得再行发明一套逻辑,技俩说明就此出动为了更相宜先容和陈说的结构。

终末一环是展示型网站。这里磨砺的就不再是文档生成智力,而是信息架构迁徙:技俩先容、中枢智力、装配使用、FAQ、参考辛勤等模块,需要被再行组织成网页抒发。DuMate 最毕生成了可土产货预览的静态网站目次。这意味着归并套事实底稿,如故不仅仅能被 " 写成文档 ",而是能被“作念成网站”。

把这四项托福串起来看,DuMate 此次最有价值的施展,并不是某一个单项上作念得比别东说念主更漂亮,而是它在谈论—整理—文献生成—展示化输出这条链路上可靠地跑完了全程。关于办公 Agent 来说,在多个任务技艺之间能顺滑地衔尾,恰正是落地最重要的门槛。
桌面级 AI 办公器具的 PMF 分水岭
从“单次生成”到“任务闭环”,桌面级 AI 办公器具正在经验一场抑遏拒却的范式出动。
回看曩昔一年的 AI 办公赛说念,大多数居品的逻辑依然是“发问 - 生成 - 复制”的三步轮回。用户在对话框里输入需求,AI 复返一段翰墨或一张图表,用户再手动把它搬到 Word、PPT 或邮件里。但复制这个动作,恰正是拦住办公 Agent 落地的终末通盘门槛,它让 AI 只可饰演内容供应商的脚色,而不是简直接办、实践这套责任流。
这类居品无法镶嵌往常办公场景,也不可被称为办公助手。DuMate 此次展示的见识,即是办公 Agent 从“内容提供商”到“办公搭子”的转向,这亦然办公 Agent 赛说念尔后简直的技艺分水岭。
一位长久怜惜 AI 办公赛说念的投资东说念主向咱们涌现,2025 年到 2026 年上半年,主流 AI 办公居品其实都在作念归并件事,那即是把对话交互作念得更运动、把模子幻觉率压得更低、把生成速率压到秒级。但这些方针的升迁,本体上照旧在优化“单次生成体验”。而简直的战场,如故在向“任务闭环智力”出动。让 AI 在简直责任流里跑十足程,仅仅异日留在牌桌上的入场券。
这是买卖闭环逻辑之下的势必聘任,订阅制的 AI 办公居品最怕的不是用户流失,而是“用不起来”。即使用户付了月费,但要是只拿来写周报,ROI 算不外来,终末照旧会停掉续费,这么的居品是莫得 PMF 可言的。
换言之,而当 AI 能够简直替代部分访佛性办公就业时,用户的付费意愿和续费能源才会简直被唤起,这个商场才确实有可能出现。
从被迫的“生成 - 反应”轮回,进化到主动的“感知 - 绸缪 - 实践 - 托福”,百度在这条路上的聘任很专门旨兴致。DuMate 莫得去卷对话体验或者试图用模子参数措置一切,而是把赌注押在了“实践层”,也即是让 AI 看见屏幕、操作软件、串联文献,把收场平直托福成可留存、可复用的形态。
天然,这条路并不好走。它条目 AI 系统对桌面环境有更深的感知智力,对任务有更长的牵挂和绸缪智力,对托福形态有更天确实维持智力。任何一个枢纽出现短板,闭环都会断裂。这或然亦然为什么,大多数 AI 办公居品仍然聘任停在“生成”这一层。“闭环”级别的泄露性,如实如故组成了技艺门槛和护城河。在咱们看来,这种智力很有可能是桌面级 AI 办公器具达成 PMF 的 分水岭。
DuMate 此次的压力测试,虽然也有不及。PPT 的想象、网站的交互仍有优化空间,但它如故无法用单纯的生成质料进行评价,而是在职务完成度这个更聚合简直责任场景的维度上被注目。从帮你作念得更快,到替你作念得更多,这或然即是 AI 办公赛说念简直走向进修的秀丽。
雷峰网著作 凤凰彩票「中国」有限公司