雷峰网讯 百度针对企业级场景设想的桌面级 AI 智能体 DuMate 于本年 3 月 22 日全量上线。从咱们关于 AI 办公家具的以往测评来看,能够真实参预办公场景的家具如故未几见。
DuMate 能否冲破中看不顶用的魔咒,成为一款委果能“抗活儿”的 AI 搭子?带着这么的疑问,咱们设想了一项掩饰表情研究、末端整理以及包括四种托付物的多形态输出任务。望望百度智能云 DuMate,究竟能把任务激动到什么程度。

先看家具逻辑:惩办真实责任流问题
中国一众 AI 玩家里,百度的打法一直有我方的逻辑。文心一言打头部理会市集,秒哒打无代码愚弄搭建,而 DuMate 则试图填补一个更具体的位置,个东说念主及团队的日常办公场景中,委果替代那些需要“操作软件、串联文献、托付末端”的疏导干事。
本色上,这即是桌面级 Agent 的生态位。AI 助手的价值,不在于“答得更好”,更在于“作念得更多”。当大模子的推理才略慢慢同质化,委果拉开差距的,是谁能更好地把 AI 镶嵌真实责任流,并托付可留存、可复用的末端。
凭证百度智能云公开良友,DuMate 强调的不仅仅问答,而是“看见屏幕、操作软件、处理文献、串联业务系统”。看起来浅易的功能定位,推行上掩饰了从桌面施行、责任区、技巧彭胀到腹地安全、办公托付的整条责任链。在本事逻辑上,这需要 DuMate 具备三个档次的才略。
第一层是感知与通晓。DuMate 需要通晓用户在说什么、想作念什么,这背后是将天然说话辅导映射为具体操作序列的才略。
第二层是用具调用与施行,通晓之后,DuMate 需要调起正确的用具,读写文献、操作浏览器、施行代码、调用 API。这条目它对桌面环境有真实的感知和限制才略,而非只复返一个 API 调用建议。
临了即是末端托付与存档。施行完成后,末端需要以正确的形态输出,关于办公助手来说,这时时是 Word 文档、Excel 表格、PPT 演示或者网站页面。而且托付物自己必须可留存、可复用。
本年 3 月 22 日全量上线后,DuMate 马上补皆了技巧广场、Word/PPT/Excel 优化、文献预览解析、逐日追忆、音问渠说念接入和厚爱计费等才略。在不到一个月的时老实,中枢办公才略照旧基本好意思满。DuMate 办公责任台的家具逻辑照旧越发了了:即通过一个智能体,将用户敷衍的认识,凯旋滚动为可留存、可复用的最终托付物,从而委果镶嵌并惩办真实的责任流问题。
实测:一套事实底稿,四种托付物
此次测试,咱们莫得选拔常见的“写一篇著述”或“整理一份表格”之类不痛不痒的轻任务,而是给 DuMate 打发了一项更接近真实责任的复杂任务,围绕某一个 GitHub 表情,完成一次“表情研究 + 多形态托付”任务。
比如让 AI 作念一张 excel 或者生成一张 PPT,这类任务太浅易、太干净,现实中很少有东说念主这么责任,根蒂测不出来 AI 的水平。关联词用一个真实的、参差的、多源信息的任务来捕快 AI,比如围绕一个 GitHub 表情作念任务,这正是研发、家具、本事写稿主说念主员日常会际遇的责任。要是 AI 在这种任务上阐扬可以,那它在真实办公场景中巧合率也能派上用场。
此次咱们选拔的 GitHub 表情叫作念 everything-claude-code,给不熟悉的一又友先容一下。这个表情在 GitHub 上的 Star 数照旧跳跃了 14 万。比起某种用具,它更像是一套专为 Claude Code 等 AI 编程用具设想的工程化配置系统,既能用来调教 AI,也能拿它学习如何跟 AI 打融合。
Everything-claude-code 被设想出来的目的即是把 AI 从“聊天佑手”升级成可除名法式、千里淀警戒的智能工程系统。
具体来说它惩办的是四大痛点:
捏久化记念:通过自动化钩子收场跨会话崎岖文保存,幸免换表情就失忆;
法式化经过:将树立拆解为蓄意、审查、测试等要害;
自动化检讨:内置安全扫描用具 AgentShield,含 1282 项测试和 102 条安全章程;
捏续学习:AI 自动索要灵验模式千里淀为团队常识。
通盘表情组件像一个好意思满的“ AI 树立活水线”,包括 30 多个各司其职的 Agent,150+ 个可复用 Skill 固化成的最好实践,70+ 条快捷敕令一键触发复杂经过,还有 30 余条章程组成 AI 的行径底线。
浅易来说,everything-claude-code 即是将一位资深工程师的一次性对话变成了可积蓄、可优化的“工程实践”,何况能凯旋服务于你的私东说念主 Agent 助理。
咱们为 DuMate 设想的测试任务,即是条目它对开源在 GitHub 上的 everything-claude-code 进行整理,并把这份“阴私”以 Excel 内容目次、Word 阐扬书、PPT 大纲与逐页内容、网站四种形式进行输出。
测试题目:
代码块
请围绕 GitHub 表情 everything-claude-code(https://github.com/affaan-m/everything-claude-code)完成一次“表情研究 + 多形态托付”任务。
注释:该表情不是日常愚弄,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统。请要点分析其 commands、skills、hooks、rules、guides、install scripts、配置与集成方式,不要误写成传统 SaaS 或单体软件。
请你先基于 GitHub 仓库和公开收罗良友完成研究,变成一份“结伙事实底稿”,再基于这兼并套事实底稿输出以下 4 项托付物:
1. 一份可存档的厚爱 Word 阐扬书 , 以计较机类专科竹素的方法呈现
2. 一份合适先容 / 呈文的 PPT 内容稿,面向计较机专科群体
3. 一个可腹地预览的展示型静态网站
4. 一份 Excel 统计表,用于统计面前表情的组件 / 模块 / 目次 / 关键文献数目、称呼、作用阐扬及备注
一、研究鸿沟
至少掩饰:
- 表情定位、认识用户、惩办的问题、典型场景
- commands / skills / hooks / rules / guides / scripts / 配置文献 / tests / integrations 的结构与作用
- 装置、配置、接入方式、典型用法
- 架构或责任机制
- 面前版块气象、最近更新、爱戴活跃度
- 风险、末端、不细目项
- GitHub 以外的 guide、release、官网、文档、博客、社区、教程、商酌等良友
二、结伙事实底稿
请先输出一份结构化表情谍报,动作后续全部托付物的独一事实起头。
条目:
- 先输出“结伙事实底稿”,标注【已证明】【算计】【待证明】,尽量附起头陆续
- 如有良友冲突,列出冲突点与判断依据
- 整个后续托付物必须严格基于兼并套事实底稿,彼此不得矛盾
- 不得诬捏表情中不存在的功能、组件、版块或官方信息
三、托付物条目
1)Word:面向初次战斗者,章节好意思满、专科厚爱,合适存档 / 培训 / 对外阐扬;若不可凯旋生成 .docx,则提供好意思满正文、标题层级、封面建议、排版建议和文献名
2)PPT:合适先容 / 呈文,不照搬阐扬书;先大纲后逐页;每页含标题、3-6 个要点、图示建议、演讲备注;10-18 页;若不可凯旋生成 .pptx,则提供好意思满逐页内容和文献名
3)网站:若不可凯旋发布,则生资腹地可启动的静态网站目次;至少包含首页、表情先容、中枢才略、装置使用、架构阐扬、FAQ、参考良友;提供目次结构、全部文献内容、进口文献名和大开行径;优先使用无需复杂构建的 HTML/CSS/JS
4)Excel:先阐扬统计口径;统计面前表情的目次、commands、skills、hooks、rules、scripts、docs/guides、配置文献、tests、integration targets 等数目、称呼、旅途、作用阐扬、所属类别、备注、起头依据;若不可凯旋生成 .xlsx,则提供可凯旋导入 Excel 的 CSV 或表格内容及文献名
四、输出次序
1. 研究行径与信息起头
2. 结伙事实底稿
3. Excel 统计口径与统计表
4. Word 阐扬书
5. PPT 大纲与逐页内容
6. 网站目次结构与文献内容
7. 风险阐扬、未证明项、受限项
8. 最终托付清单与建议文献名
五、全局旁边
九游体育中国体育服务中心- 整个产出必须基于兼并套事实底稿,彼此不得矛盾
- 不得诬捏 GitHub 仓库中不存在的功能、组件、版块或官方信息
- 对不细目内容必须明确标注
- 不得在无法生成真实 .docx/.pptx/.xlsx 文献时谎称“已生成完成”
这项任务的难点在于,everything-claude-code 不是日常愚弄尺度,而是一个面向 Claude Code、Codex、Cursor、OpenCode 等 AI agent harness 的性能增强系统,因此 DuMate 不可把它误写成传统 SaaS 或单体软件。
此外由于超高的热度,everything-claude-code 在收罗上有多数公开良友补充,DuMate 的研究不可局限于 GitHub 仓库。良莠不皆的公开良友又对托付质地提议了挑战,即整个内容必须基于兼并套”结伙事实底稿”,DuMate 需要甄别、舍弃那些首尾乖互的失误信息。
最终,它需要托付四样东西:一份 Word 阐扬书、一份 PPT 内容稿、一个可腹地预览的静态网站,以及一份 Excel 统计表。
DuMate 的阐扬如何呢?底下来望望:
搭底稿:先研究,后输出
第一步,DuMate 先读懂 everything-claude-code 表情,并从公开收罗补充 guide、release、文档、博客和社区良友,AG真人中国官网登录入口最终变成“结伙事实底稿”。这一步最值得看的,不光是它会不会把仓库 README 摘一遍,还有它有莫得才略把仓库内信息和仓库外信息合并起来,再组织成后续托付物共同依赖的底层材料。
从推行界面看,DuMate 莫得停留在“对话框里给一段追忆”,而是把任务拆成了多个阶段节点。右侧“进度”栏会自满面前正在生成的 Word、PPT、网站目次与最终清单等内容,左侧则能看到面前对话与责任区文献。这意味着它的施行过程不是黑箱,用户能知说念它正在作念什么、哪些文献照旧生成、后续还会走到哪一步。对一款以“真干活”为卖点的办公 Agent 来说,可不雅察、可控的使用体验是必不可少的。

更关键的是,DuMate 先搭底稿,再作念输出。这个动作的价值在于:一朝底稿成型,后头的 Word、PPT、网站和 Excel 才有可能保捏前后一致。对有过真实表情履历的东说念主来说,最耗东说念主的时时不是写材料,而是来去查对材料之间是否矛盾。DuMate 阐扬出来的,是一种更接近表情责任的研究先行 + 一稿多用想路。


Excel 统计:统计口径先行
在事实底稿之后,DuMate 被条目生成 Excel 统计表。这里的难点不是“作念个表”,而是要明确统计口径,梳理表情模块、目次、关键文献、数目、旅途、作用阐扬和备注,何况与前边的磋接洽断保捏一致。
推行任务中,它给出的不是一张临时列表,而是一份更接近可二次使用的统计材料,包含统计口径阐扬、各字段界说,以及能够与后续文档交叉查对的结构化数据。

Word 阐扬书:参预真实文献生成经过
接着是 Word 阐扬书。这一步更像托付考证,日常聊天佑手时时只可给你一段“可以复制到 Word 里”的正文,而 DuMate 则参预了真实文献生成经过,临了凯旋拿出一个可以凯旋预览的 .docx 文档。
用户看到的不再是“文本建议”,而是一个照旧生成出来、可以陆续流转和保存的文献。这其中的差距,远比听上去的大。

到这一步,托付物照旧展现出了不俗的落地价值。everything-claude-code 自己即是极具共享价值的实践警戒,在此基础上变成的本事阐扬书,更是把这份“大牛指南”掰开揉碎了喂给用户。架构设想和中枢组件先容都是最基本的,这份 35 页的文档里,一半以上都是可以凯旋辅导 Agent 实践的部署教程和最好实践案例。就连高频出现的问题,都整理成了一份故障摒除指南。

PPT + 网站:内容形态切换
PPT 的呈现恶果也可以。事实上这个要害的难点从来不在于把文档压缩到几个画面上,而是要让内容从书面论说切换到视觉抒发。DuMate 在这一要害陆续沿用兼并套事实底稿,莫得再行发明一套逻辑,表情阐扬就此滚动为了更合适先容和呈文的结构。

临了一环是展示型网站。这里测验的就不再是文档生成才略,而是信息架构挪动:表情先容、中枢才略、装置使用、FAQ、参考良友等模块,需要被再行组织成网页抒发。DuMate 最终身成了可腹地预览的静态网站目次。这意味着兼并套事实底稿,照旧不仅仅能被 " 写成文档 ",而是能被“作念成网站”。

把这四项托付串起来看,DuMate 此次最有价值的阐扬,并不是某一个单项上作念得比别东说念主更漂亮,而是它在研究—整理—文献生成—展示化输出这条链路上可靠地跑结束全程。关于办公 Agent 来说,在多个任务才略之间能顺滑地衔尾,恰正是落地最关键的门槛。
桌面级 AI 办公用具的 PMF 分水岭
从“单次生成”到“任务闭环”,桌面级 AI 办公用具正在履历一场扼制远隔的范式转念。
回看以前一年的 AI 办公赛说念,大多数家具的逻辑依然是“发问 - 生成 - 复制”的三步轮回。用户在对话框里输入需求,AI 复返一段笔墨或一张图表,用户再手动把它搬到 Word、PPT 或邮件里。但复制这个动作,恰正是拦住办公 Agent 落地的临了沿途门槛,它让 AI 只可饰演内容供应商的变装,而不是委果接办、施行这套责任流。
这类家具无法镶嵌日常办公场景,也不可被称为办公助手。DuMate 此次展示的场地,即是办公 Agent 从“内容提供商”到“办公搭子”的转向,这亦然办公 Agent 赛说念尔后委果的本事分水岭。
一位弥远暖热 AI 办公赛说念的投资东说念主向咱们涌现,2025 年到 2026 年上半年,主流 AI 办公家具其实都在作念兼并件事,那即是把对话交互作念得更通顺、把模子幻觉率压得更低、把生成速率压到秒级。但这些目的的提高,本色上如故在优化“单次生成体验”。而委果的战场,照旧在向“任务闭环才略”转念。让 AI 在真实责任流里跑填塞程,仅仅异日留在牌桌上的入场券。
这是营业闭环逻辑之下的势必选拔,订阅制的 AI 办公家具最怕的不是用户流失,而是“用不起来”。即使用户付了月费,但要是只拿来写周报,ROI 算不外来,临了如故会停掉续费,这么的家具是莫得 PMF 可言的。
换言之,而当 AI 能够委果替代部分疏导性办公干事时,用户的付费意愿和续费能源才会委果被唤起,这个市集才简直有可能出现。
从被迫的“生成 - 反映”轮回,进化到主动的“感知 - 蓄意 - 施行 - 托付”,百度在这条路上的选拔很有利思。DuMate 莫得去卷对话体验或者试图用模子参数惩办一切,而是把赌注押在了“施行层”,也即是让 AI 看见屏幕、操作软件、串联文献,把末端凯旋托付成可留存、可复用的形态。
天然,这条路并不好走。它条目 AI 系统对桌面环境有更深的感知才略,对任务有更长的记念和蓄意才略,对托付形态有更生动的维持才略。任何一个要害出现短板,闭环都会断裂。这巧合亦然为什么,大多数 AI 办公家具仍然选拔停在“生成”这一层。“闭环”级别的踏实性,照实照旧组成了本事门槛和护城河。在咱们看来,这种才略很有可能是桌面级 AI 办公用具达成 PMF 的 分水岭。
DuMate 此次的压力测试,天然也有不及。PPT 的设想、网站的交互仍有优化空间,但它照旧无法用单纯的生成质地进行评价,而是在职务完成度这个更围聚真实责任场景的维度上被谛视。从帮你作念得更快,到替你作念得更多,这巧合即是 AI 办公赛说念委果走向闇练的艳丽。
雷峰网著述 AG真人中国官网登录入口