Microsoft Copilot Studio「电脑使用代理」正式上线:AI 直接操作网页和桌面应用,企业自动化进入新阶段
Microsoft Copilot Studio「电脑使用代理」正式上线:AI 直接操作网页和桌面应用,企业自动化进入新阶段
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
5 月 26 日,微软宣布 Copilot Studio 中的「Computer-Using Agents」(电脑使用代理)功能正式进入 GA(General Availability)阶段,面向所有商业地区的 Power Platform 用户开放。这意味着企业现在可以构建 AI Agent,让它像人一样通过界面点击、输入、导航来操作网页和桌面应用——不再需要目标系统提供 API。
解决什么问题
很多企业内部系统(ERP、老旧 Web 应用、第三方 SaaS)没有开放 API,过去只能靠人工操作或脆弱的脚本自动化。Computer-Using Agents 让 AI 直接「看到」并操作这些界面,把重复性的跨系统操作交给 Agent 完成。
这次 GA 带来了什么
相比去年 9 月的预览版,正式版新增了多项企业级能力:
- 凭据安全管理:Agent 操作需要登录的系统时,凭据通过平台统一管理,不再明文暴露
- 多模型选择:可根据不同自动化场景选择最合适的底层模型
- 自适应界面变化:界面布局改变时 Agent 能自动适应,不会因为按钮换了位置就失败
- 审计与合规:所有操作会话记录到 Microsoft Purview 和 Dataverse,支持会话回放
- 人工审批节点:可在关键步骤设置人工确认,低置信度操作自动暂停等待审批
与工作流深度集成
Computer-Using Agents 现在可以嵌入 Copilot Studio 的多步骤工作流中(目前为 preview)。这意味着一个自动化流程可以同时包含 API 调用、业务逻辑判断和 UI 操作——比如先通过 API 查询订单状态,再用 Agent 登录老系统填写表单,最后触发审批流程。
微软同时推出了重新设计的工作流可视化编辑器,支持在统一画布上编排所有步骤。
竞品现状
基于多家媒体转述整理:目前微软是唯一一家将 Computer-Use Agent 能力推向正式 GA 并提供商业 SLA 的平台。Anthropic 的 Claude Computer Use 仍处于付费用户 Beta 阶段,Google 的 Gemini Computer Use 为公开预览。对于正在做采购决策的企业来说,微软目前在合规保障和部署覆盖上有明确优势。
典型场景
- 没有 API 的内部老系统数据录入
- 跨多个 Web 应用的流程串联(如从 CRM 复制信息到财务系统)
- 需要登录第三方平台执行操作的定期任务
使用门槛
需要 Microsoft Power Platform 商业许可(Copilot Studio 包含在内)。目前仅面向商业客户,个人用户暂不可用。实时语音交互功能也在本次更新中一并推出,支持通过语音与 Agent 对话。
---
来源:Microsoft Copilot Blog(2026-05-26)、TechHQ、ADTmag
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。