AI Agent 的 USB-C —— 一文读懂四大协议
AI Agent 的 USB-C —— 一文读懂四大协议
小天想做一个 AI Agent。
能读他的日历、查他的邮件、还能写代码跑起来。
他发现一个很头疼的问题:
每个数据源都要单独对接。
Claude 用一套 API,ChatGPT 用另一套。
飞书要单独写,Notion 又不一样。
“为什么没有统一标准?”
答案是:正在形成。
而且不止一个。
2026 年,AI Agent 正在经历从”对话工具”到”自主执行者”的转变。
这个转变背后,有四个开放协议正在构建互操作生态。
它们分别是:MCP、A2A、ACP、Skills。
看起来很复杂?
别急,一个一个来。
一、MCP:Agent 的 USB-C
先从最核心的说起。
MCP(Model Context Protocol),Anthropic 主导的开源标准。
它解决一个问题:Agent 怎么连接数据源?
一个类比
以前手机充电有多乱?
Micro-USB、Lightning、Type-C……每家都有自己的接口。
后来 USB-C 统一了。
一根线,所有设备都能用。
MCP 就是 Agent 世界里的 USB-C。
写一个 MCP Server,Claude 能用,ChatGPT 能用,VS Code 也能用。
一次开发,处处可用。
它怎么工作?
MCP 采用 Client-Server 架构:
1 | 你的 Agent(Host) |
- Host:AI 应用,比如 Claude Code、Cursor
- Client:维护连接的组件
- Server:提供数据的程序
Server 可以跑在本地(STDIO 传输),也可以跑在远程(HTTP 传输)。
核心概念:四类能力
MCP Server 可以暴露四种能力:
| 能力 | 作用 | 例子 |
|---|---|---|
| Resources | 暴露数据源 | 文件内容、数据库记录、API 响应 |
| Tools | 提供可执行操作 | 发送邮件、创建文件、调用 API |
| Prompts | 预定义提示词模板 | “帮我总结这篇文章”、”生成代码审查报告” |
| Sampling | 请求 LLM 生成 | 让 Server 主动请求 Agent 生成内容 |
传输方式
MCP 支持两种传输:
- STDIO:本地通信,Server 作为子进程运行,通过标准输入输出交换 JSON 消息
- HTTP/SSE:远程通信,支持 Server-Sent Events 实现流式响应
谁在支持?
已经不少了:
- Claude(Anthropic 自家)
- ChatGPT(OpenAI 已宣布支持)
- VS Code(微软)
- Cursor
“MCP 就像 AI 应用的 USB-C 接口” — Anthropic 官方
二、A2A:Agent 之间的普通话
MCP 解决了 Agent 连接数据的问题。
但小天很快遇到新问题。
他同事小李,用的是另一个 Agent。
两个 Agent 怎么协作?
这就轮到 A2A(Agent2Agent Protocol) 登场了。
它解决什么?
Agent 与 Agent 之间的通信。
在 2026 年,Agent 可能用不同框架构建,来自不同厂商。
A2A 提供了它们之间协作的通用语言。
核心概念:Agent Card
A2A 的关键是 Agent Card——一个 JSON 文件,描述 Agent 的能力:
1 | { |
Agent 通过 Agent Card 发现彼此的能力,决定如何协作。
通信方式
A2A 基于 JSON-RPC 2.0,支持三种通信模式:
| 模式 | 适用场景 |
|---|---|
| 请求/响应 | 简单任务,同步完成 |
| 流式(SSE) | 长任务,实时返回进度 |
| 异步推送 | 后台任务,完成后通知 |
关键特性
- 能力发现:通过 Agent Card 了解对方能做什么
- 不透明协作:Agent 不需要暴露内部状态、记忆或工具实现
- 多模态支持:文本、文件、结构化 JSON 数据
- 企业级安全:内置认证和可观测性设计
Google 的定位
Google 官方有一句话总结:
“Build with ADK, equip with MCP, communicate with A2A”
翻译过来:
- 用 ADK 构建 Agent
- 用 MCP 连接工具
- 用 A2A 和其他 Agent 通信
MCP 和 A2A 不是竞争关系。
一个解决 Agent 连数据,一个解决 Agent 连 Agent。
生态热度
A2A 由 Google 开发,后来捐赠给 Linux Foundation。
GitHub 上已经有 22.4k stars。
DeepLearning.AI 还出了专门的课程:《A2A: The Agent2Agent Protocol》。
三、ACP:Agent 连接编辑器
第三个协议,解决的是另一个问题。
ACP(Agent Client Protocol),标准化了代码编辑器/IDE 与编码 Agent 之间的通信。
它解决:Agent 怎么和编辑器协作?
为什么需要它?
AI 编码 Agent 和编辑器紧密耦合,但互操作性不是默认的。
每个编辑器想支持一个 Agent,就要单独写集成。
每个 Agent 想触达用户,就要实现编辑器专属 API。
这导致三个问题:
- 集成开销:每个 Agent-编辑器组合都要定制开发
- 兼容性有限:Agent 只能工作在部分编辑器里
- 开发者锁定:选了 Agent,就被迫接受它支持的编辑器
LSP 的启示
还记得 LSP(Language Server Protocol) 吗?
它标准化了编辑器和语言服务器之间的通信。
一个 LSP Server,所有编辑器都能用。
ACP 做的是同样的事,只是对象换成了 AI Agent。
实现 ACP 的 Agent,能和任何兼容编辑器协作。
支持 ACP 的编辑器,能接入整个 ACP Agent 生态。
它怎么工作?
ACP 支持两种场景:
- 本地 Agent:作为编辑器子进程运行,通过 stdio 的 JSON-RPC 通信
- 远程 Agent:托管在云端,通过 HTTP 或 WebSocket 通信
技术上,ACP 尽可能复用 MCP 的 JSON 表示,但也包含自定义类型——比如显示 diff 的 UI 元素。
谁在支持?
- Zed Industries:联合发起方
- JetBrains:已宣布支持
- GitHub:代码仓库开源
ACP 就像编辑器世界的”统一接口”——一次实现,处处可用。
四、Skills:Agent 的技能卡
最后一个,Agent Skills。
这是一个开放规范,定义了如何为 Agent 编写可复用的技能模块。
类比一下
就像游戏角色装备技能卡。
Agent 加载 Skills,获得新能力。
它的结构很简单
1 | skill-name/ |
SKILL.md 是一个 YAML + Markdown 文件:
1 |
|
核心能力
Skills 支持三种能力:
| 能力 | 说明 |
|---|---|
| 触发识别 | 通过 description 中的关键词,Agent 自动判断何时激活该技能 |
| 执行指导 | SKILL.md 正文提供详细的执行步骤和注意事项 |
| 工具预授权 | allowed-tools 字段可预批准特定工具,减少确认步骤 |
模型选择机制
Skills 还可以建议使用特定模型:
1 |
|
这让 Agent 能够根据任务特性,选择最适合的模型:
- 代码审查 → 推荐 Claude 3 Opus(强推理)
- 快速总结 → 推荐 GPT-4o-mini(低成本)
- 图像理解 → 推荐 GPT-4 Vision
为什么重要?
- 可分享:写好的技能可以发给社区
- 可复用:一个技能多个 Agent 都能用
- 可积累:技能库会越来越丰富
- 成本优化:根据任务选模型,避免大材小用
五、四大协议如何协作?
看到这里你可能有点晕。
四个协议,到底谁连谁?
来一张简化版的关系图:
1 | 用户 |
一个典型的开发者工作流:
- 用户在编辑器里写代码(Zed、Cursor、JetBrains)
- 编辑器通过 ACP 调用 Agent(”帮我重构这个函数”)
- Agent 通过 MCP 读取代码仓库、调用工具
- Agent 通过 A2A 与其他 Agent 协作(比如让另一个 Agent 做代码审查)
- Agent 加载 Skills 获得特定能力(比如某个框架的专家技能)
用一句话总结:
| 协议 | 解决的问题 |
|---|---|
| MCP | Agent 连数据 |
| A2A | Agent 连 Agent |
| ACP | 编辑器连 Agent |
| Skills | Agent 学技能 |
四个协议,四层连接。
缺一不可。
这意味着什么?
对普通用户
更智能的 AI 助手。
一次配置,处处可用。
你的 Agent 能读日历、查邮件、写代码,还能和其他 Agent 协作。
对开发者
新的机会正在涌现。
- MCP Server 开发者生态
- Skills 创作者经济
- Agent 间协作应用
掌握协议 = 掌握 Agent 时代的”HTTP”
对行业
从”孤岛 Agent”到”互联生态”。
2023 年,我们在用单一聊天机器人。
2026 年,Agent 已经能互相协作、共享技能、连接任意数据源。
标准化正在加速这个过程。
写在最后
回到小天的问题:
“为什么没有统一标准?”
现在有了。
而且不止一个——MCP、A2A、ACP、Skills 各司其职。
它们正在共同构建 Agent 时代的协议联邦。
就像 TCP/IP 统一了互联网,HTTP 统一了 Web。
这些协议,正在统一 AI Agent 的连接方式。
协议标准化,是 Agent 从玩具变成工具的关键一步。
延伸阅读:


