AI Agent 的 USB-C —— 一文读懂四大协议

小天想做一个 AI Agent。

能读他的日历、查他的邮件、还能写代码跑起来。

他发现一个很头疼的问题:

每个数据源都要单独对接

Claude 用一套 API,ChatGPT 用另一套。

飞书要单独写,Notion 又不一样。

“为什么没有统一标准?”

答案是:正在形成。

而且不止一个。

2026 年,AI Agent 正在经历从”对话工具”到”自主执行者”的转变。

这个转变背后,有四个开放协议正在构建互操作生态。

它们分别是:MCP、A2A、ACP、Skills

看起来很复杂?

别急,一个一个来。


一、MCP:Agent 的 USB-C

先从最核心的说起。

MCP(Model Context Protocol),Anthropic 主导的开源标准。

它解决一个问题:Agent 怎么连接数据源?

一个类比

以前手机充电有多乱?

Micro-USB、Lightning、Type-C……每家都有自己的接口。

后来 USB-C 统一了。

一根线,所有设备都能用。

MCP 就是 Agent 世界里的 USB-C。

写一个 MCP Server,Claude 能用,ChatGPT 能用,VS Code 也能用。

一次开发,处处可用。

它怎么工作?

MCP 采用 Client-Server 架构

1
2
3
4
你的 Agent(Host)
├── MCP Client → 日历 Server
├── MCP Client → 邮件 Server
└── MCP Client → 代码 Server
  • Host:AI 应用,比如 Claude Code、Cursor
  • Client:维护连接的组件
  • Server:提供数据的程序

Server 可以跑在本地(STDIO 传输),也可以跑在远程(HTTP 传输)。

核心概念:四类能力

MCP Server 可以暴露四种能力:

能力 作用 例子
Resources 暴露数据源 文件内容、数据库记录、API 响应
Tools 提供可执行操作 发送邮件、创建文件、调用 API
Prompts 预定义提示词模板 “帮我总结这篇文章”、”生成代码审查报告”
Sampling 请求 LLM 生成 让 Server 主动请求 Agent 生成内容

传输方式

MCP 支持两种传输:

  • STDIO:本地通信,Server 作为子进程运行,通过标准输入输出交换 JSON 消息
  • HTTP/SSE:远程通信,支持 Server-Sent Events 实现流式响应

谁在支持?

已经不少了:

  • Claude(Anthropic 自家)
  • ChatGPT(OpenAI 已宣布支持)
  • VS Code(微软)
  • Cursor

“MCP 就像 AI 应用的 USB-C 接口” — Anthropic 官方


二、A2A:Agent 之间的普通话

MCP 解决了 Agent 连接数据的问题。

但小天很快遇到新问题。

他同事小李,用的是另一个 Agent。

两个 Agent 怎么协作?

这就轮到 A2A(Agent2Agent Protocol) 登场了。

它解决什么?

Agent 与 Agent 之间的通信。

在 2026 年,Agent 可能用不同框架构建,来自不同厂商。

A2A 提供了它们之间协作的通用语言

核心概念:Agent Card

A2A 的关键是 Agent Card——一个 JSON 文件,描述 Agent 的能力:

1
2
3
4
5
6
7
8
9
10
{
"name": "代码审查 Agent",
"description": "专业代码审查,支持多种语言",
"capabilities": {
"text": true,
"files": true,
"streaming": true
},
"endpoint": "https://agent.example.com/a2a"
}

Agent 通过 Agent Card 发现彼此的能力,决定如何协作。

通信方式

A2A 基于 JSON-RPC 2.0,支持三种通信模式:

模式 适用场景
请求/响应 简单任务,同步完成
流式(SSE) 长任务,实时返回进度
异步推送 后台任务,完成后通知

关键特性

  • 能力发现:通过 Agent Card 了解对方能做什么
  • 不透明协作:Agent 不需要暴露内部状态、记忆或工具实现
  • 多模态支持:文本、文件、结构化 JSON 数据
  • 企业级安全:内置认证和可观测性设计

Google 的定位

Google 官方有一句话总结:

“Build with ADK, equip with MCP, communicate with A2A”

翻译过来:

  • 用 ADK 构建 Agent
  • 用 MCP 连接工具
  • 用 A2A 和其他 Agent 通信

MCP 和 A2A 不是竞争关系

一个解决 Agent 连数据,一个解决 Agent 连 Agent。

生态热度

A2A 由 Google 开发,后来捐赠给 Linux Foundation。

GitHub 上已经有 22.4k stars

DeepLearning.AI 还出了专门的课程:《A2A: The Agent2Agent Protocol》。


三、ACP:Agent 连接编辑器

第三个协议,解决的是另一个问题。

ACP(Agent Client Protocol),标准化了代码编辑器/IDE 与编码 Agent 之间的通信。

它解决:Agent 怎么和编辑器协作?

为什么需要它?

AI 编码 Agent 和编辑器紧密耦合,但互操作性不是默认的。

每个编辑器想支持一个 Agent,就要单独写集成

每个 Agent 想触达用户,就要实现编辑器专属 API

这导致三个问题:

  • 集成开销:每个 Agent-编辑器组合都要定制开发
  • 兼容性有限:Agent 只能工作在部分编辑器里
  • 开发者锁定:选了 Agent,就被迫接受它支持的编辑器

LSP 的启示

还记得 LSP(Language Server Protocol) 吗?

它标准化了编辑器和语言服务器之间的通信。

一个 LSP Server,所有编辑器都能用。

ACP 做的是同样的事,只是对象换成了 AI Agent。

实现 ACP 的 Agent,能和任何兼容编辑器协作。

支持 ACP 的编辑器,能接入整个 ACP Agent 生态。

它怎么工作?

ACP 支持两种场景:

  • 本地 Agent:作为编辑器子进程运行,通过 stdio 的 JSON-RPC 通信
  • 远程 Agent:托管在云端,通过 HTTP 或 WebSocket 通信

技术上,ACP 尽可能复用 MCP 的 JSON 表示,但也包含自定义类型——比如显示 diff 的 UI 元素。

谁在支持?

  • Zed Industries:联合发起方
  • JetBrains:已宣布支持
  • GitHub:代码仓库开源

ACP 就像编辑器世界的”统一接口”——一次实现,处处可用。


四、Skills:Agent 的技能卡

最后一个,Agent Skills

这是一个开放规范,定义了如何为 Agent 编写可复用的技能模块

类比一下

就像游戏角色装备技能卡。

Agent 加载 Skills,获得新能力。

它的结构很简单

1
2
skill-name/
└── SKILL.md # 必需:描述 + 使用说明

SKILL.md 是一个 YAML + Markdown 文件:

1
2
3
4
5
6
7
8
9
10
---
name: pdf-processing
description: |
提取 PDF 文本、填写表单、合并文件。
当用户提到 PDF 或文档处理时触发。
---

# PDF Processing Skill

[ Agent 的使用说明]

核心能力

Skills 支持三种能力:

能力 说明
触发识别 通过 description 中的关键词,Agent 自动判断何时激活该技能
执行指导 SKILL.md 正文提供详细的执行步骤和注意事项
工具预授权 allowed-tools 字段可预批准特定工具,减少确认步骤

模型选择机制

Skills 还可以建议使用特定模型

1
2
3
4
5
6
7
---
name: code-review
description: 专业的代码审查技能。
metadata:
recommended_model: claude-3-opus
reasoning: 需要强大的代码理解和分析能力
---

这让 Agent 能够根据任务特性,选择最适合的模型

  • 代码审查 → 推荐 Claude 3 Opus(强推理)
  • 快速总结 → 推荐 GPT-4o-mini(低成本)
  • 图像理解 → 推荐 GPT-4 Vision

为什么重要?

  • 可分享:写好的技能可以发给社区
  • 可复用:一个技能多个 Agent 都能用
  • 可积累:技能库会越来越丰富
  • 成本优化:根据任务选模型,避免大材小用

五、四大协议如何协作?

看到这里你可能有点晕。

四个协议,到底谁连谁?

来一张简化版的关系图:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
用户


编辑器 ──ACP──→ 编码 Agent
│ │
│ MCP
│ ↓
│ 数据/工具
│ │
│ A2A
│ ↓
│ 其他 Agent
│ │
└────────────── Skills

技能库

一个典型的开发者工作流:

  1. 用户在编辑器里写代码(Zed、Cursor、JetBrains)
  2. 编辑器通过 ACP 调用 Agent(”帮我重构这个函数”)
  3. Agent 通过 MCP 读取代码仓库、调用工具
  4. Agent 通过 A2A 与其他 Agent 协作(比如让另一个 Agent 做代码审查)
  5. Agent 加载 Skills 获得特定能力(比如某个框架的专家技能)

用一句话总结:

协议 解决的问题
MCP Agent 连数据
A2A Agent 连 Agent
ACP 编辑器连 Agent
Skills Agent 学技能

四个协议,四层连接。

缺一不可。


这意味着什么?

对普通用户

更智能的 AI 助手。

一次配置,处处可用。

你的 Agent 能读日历、查邮件、写代码,还能和其他 Agent 协作。

对开发者

新的机会正在涌现。

  • MCP Server 开发者生态
  • Skills 创作者经济
  • Agent 间协作应用

掌握协议 = 掌握 Agent 时代的”HTTP”

对行业

从”孤岛 Agent”到”互联生态”。

2023 年,我们在用单一聊天机器人。

2026 年,Agent 已经能互相协作、共享技能、连接任意数据源。

标准化正在加速这个过程。


写在最后

回到小天的问题:

“为什么没有统一标准?”

现在有了。

而且不止一个——MCP、A2A、ACP、Skills 各司其职。

它们正在共同构建 Agent 时代的协议联邦

就像 TCP/IP 统一了互联网,HTTP 统一了 Web。

这些协议,正在统一 AI Agent 的连接方式。

协议标准化,是 Agent 从玩具变成工具的关键一步。


延伸阅读