Microsoft Copilot Studio「电脑使用代理」正式上线:AI 直接操作网页和桌面应用,企业自动化进入新阶段

分类: AI未开源软件工具 |发布于: 5/28/2026 |最后更新: 5/28/2026
Microsoft Copilot Studio「电脑使用代理」正式上线:AI 直接操作网页和桌面应用,企业自动化进入新阶段

Microsoft Copilot Studio「电脑使用代理」正式上线:AI 直接操作网页和桌面应用,企业自动化进入新阶段

基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。

5 月 26 日,微软宣布 Copilot Studio 中的「Computer-Using Agents」(电脑使用代理)功能正式进入 GA(General Availability)阶段,面向所有商业地区的 Power Platform 用户开放。这意味着企业现在可以构建 AI Agent,让它像人一样通过界面点击、输入、导航来操作网页和桌面应用——不再需要目标系统提供 API。

解决什么问题

很多企业内部系统(ERP、老旧 Web 应用、第三方 SaaS)没有开放 API,过去只能靠人工操作或脆弱的脚本自动化。Computer-Using Agents 让 AI 直接「看到」并操作这些界面,把重复性的跨系统操作交给 Agent 完成。

这次 GA 带来了什么

相比去年 9 月的预览版,正式版新增了多项企业级能力:

  • 凭据安全管理:Agent 操作需要登录的系统时,凭据通过平台统一管理,不再明文暴露
  • 多模型选择:可根据不同自动化场景选择最合适的底层模型
  • 自适应界面变化:界面布局改变时 Agent 能自动适应,不会因为按钮换了位置就失败
  • 审计与合规:所有操作会话记录到 Microsoft Purview 和 Dataverse,支持会话回放
  • 人工审批节点:可在关键步骤设置人工确认,低置信度操作自动暂停等待审批

与工作流深度集成

Computer-Using Agents 现在可以嵌入 Copilot Studio 的多步骤工作流中(目前为 preview)。这意味着一个自动化流程可以同时包含 API 调用、业务逻辑判断和 UI 操作——比如先通过 API 查询订单状态,再用 Agent 登录老系统填写表单,最后触发审批流程。

微软同时推出了重新设计的工作流可视化编辑器,支持在统一画布上编排所有步骤。

竞品现状

基于多家媒体转述整理:目前微软是唯一一家将 Computer-Use Agent 能力推向正式 GA 并提供商业 SLA 的平台。Anthropic 的 Claude Computer Use 仍处于付费用户 Beta 阶段,Google 的 Gemini Computer Use 为公开预览。对于正在做采购决策的企业来说,微软目前在合规保障和部署覆盖上有明确优势。

典型场景

  • 没有 API 的内部老系统数据录入
  • 跨多个 Web 应用的流程串联(如从 CRM 复制信息到财务系统)
  • 需要登录第三方平台执行操作的定期任务

使用门槛

需要 Microsoft Power Platform 商业许可(Copilot Studio 包含在内)。目前仅面向商业客户,个人用户暂不可用。实时语音交互功能也在本次更新中一并推出,支持通过语音与 Agent 对话。

---

来源:Microsoft Copilot Blog(2026-05-26)、TechHQ、ADTmag

参考来源

说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。