AI Agent 的 USB-C —— 一文读懂四大协议

小天想做一个 AI Agent。

能读他的日历、查他的邮件、还能写代码跑起来。

他发现一个很头疼的问题：

每个数据源都要单独对接。

Claude 用一套 API，ChatGPT 用另一套。

飞书要单独写，Notion 又不一样。

“为什么没有统一标准？”

答案是：正在形成。

而且不止一个。

2026 年，AI Agent 正在经历从”对话工具”到”自主执行者”的转变。

这个转变背后，有四个开放协议正在构建互操作生态。

它们分别是：MCP、A2A、ACP、Skills。

看起来很复杂？

别急，一个一个来。

一、MCP：Agent 的 USB-C

先从最核心的说起。

MCP（Model Context Protocol），Anthropic 主导的开源标准。

它解决一个问题：Agent 怎么连接数据源？

一个类比

以前手机充电有多乱？

Micro-USB、Lightning、Type-C……每家都有自己的接口。

后来 USB-C 统一了。

一根线，所有设备都能用。

MCP 就是 Agent 世界里的 USB-C。

写一个 MCP Server，Claude 能用，ChatGPT 能用，VS Code 也能用。

一次开发，处处可用。

它怎么工作？

MCP 采用 Client-Server 架构：

你的 Agent（Host）
    ├── MCP Client → 日历 Server
    ├── MCP Client → 邮件 Server
    └── MCP Client → 代码 Server

Host：AI 应用，比如 Claude Code、Cursor
Client：维护连接的组件
Server：提供数据的程序

Server 可以跑在本地（STDIO 传输），也可以跑在远程（HTTP 传输）。

核心概念：四类能力

MCP Server 可以暴露四种能力：

能力	作用	例子
Resources	暴露数据源	文件内容、数据库记录、API 响应
Tools	提供可执行操作	发送邮件、创建文件、调用 API
Prompts	预定义提示词模板	“帮我总结这篇文章”、”生成代码审查报告”
Sampling	请求 LLM 生成	让 Server 主动请求 Agent 生成内容

传输方式

MCP 支持两种传输：

STDIO：本地通信，Server 作为子进程运行，通过标准输入输出交换 JSON 消息
HTTP/SSE：远程通信，支持 Server-Sent Events 实现流式响应

谁在支持？

已经不少了：

Claude（Anthropic 自家）
ChatGPT（OpenAI 已宣布支持）
VS Code（微软）
Cursor

“MCP 就像 AI 应用的 USB-C 接口” — Anthropic 官方

二、A2A：Agent 之间的普通话

MCP 解决了 Agent 连接数据的问题。

但小天很快遇到新问题。

他同事小李，用的是另一个 Agent。

两个 Agent 怎么协作？

这就轮到 A2A（Agent2Agent Protocol） 登场了。

它解决什么？

Agent 与 Agent 之间的通信。

在 2026 年，Agent 可能用不同框架构建，来自不同厂商。

A2A 提供了它们之间协作的通用语言。

核心概念：Agent Card

A2A 的关键是 Agent Card——一个 JSON 文件，描述 Agent 的能力：

{
  "name": "代码审查 Agent",
  "description": "专业代码审查，支持多种语言",
  "capabilities": {
    "text": true,
    "files": true,
    "streaming": true
  },
  "endpoint": "https://agent.example.com/a2a"
}

Agent 通过 Agent Card 发现彼此的能力，决定如何协作。

通信方式

A2A 基于 JSON-RPC 2.0，支持三种通信模式：

模式	适用场景
请求/响应	简单任务，同步完成
流式（SSE）	长任务，实时返回进度
异步推送	后台任务，完成后通知

关键特性

能力发现：通过 Agent Card 了解对方能做什么
不透明协作：Agent 不需要暴露内部状态、记忆或工具实现
多模态支持：文本、文件、结构化 JSON 数据
企业级安全：内置认证和可观测性设计

Google 的定位

Google 官方有一句话总结：

“Build with ADK, equip with MCP, communicate with A2A”

翻译过来：

用 ADK 构建 Agent
用 MCP 连接工具
用 A2A 和其他 Agent 通信

MCP 和 A2A 不是竞争关系。

一个解决 Agent 连数据，一个解决 Agent 连 Agent。

生态热度

A2A 由 Google 开发，后来捐赠给 Linux Foundation。

GitHub 上已经有 22.4k stars。

DeepLearning.AI 还出了专门的课程：《A2A: The Agent2Agent Protocol》。

三、ACP：Agent 连接编辑器

第三个协议，解决的是另一个问题。

ACP（Agent Client Protocol），标准化了代码编辑器/IDE 与编码 Agent 之间的通信。

它解决：Agent 怎么和编辑器协作？

为什么需要它？

AI 编码 Agent 和编辑器紧密耦合，但互操作性不是默认的。

每个编辑器想支持一个 Agent，就要单独写集成。

每个 Agent 想触达用户，就要实现编辑器专属 API。

这导致三个问题：

集成开销：每个 Agent-编辑器组合都要定制开发
兼容性有限：Agent 只能工作在部分编辑器里
开发者锁定：选了 Agent，就被迫接受它支持的编辑器

LSP 的启示

还记得 LSP（Language Server Protocol） 吗？

它标准化了编辑器和语言服务器之间的通信。

一个 LSP Server，所有编辑器都能用。

ACP 做的是同样的事，只是对象换成了 AI Agent。

实现 ACP 的 Agent，能和任何兼容编辑器协作。

支持 ACP 的编辑器，能接入整个 ACP Agent 生态。

它怎么工作？

ACP 支持两种场景：

本地 Agent：作为编辑器子进程运行，通过 stdio 的 JSON-RPC 通信
远程 Agent：托管在云端，通过 HTTP 或 WebSocket 通信

技术上，ACP 尽可能复用 MCP 的 JSON 表示，但也包含自定义类型——比如显示 diff 的 UI 元素。

谁在支持？

Zed Industries：联合发起方
JetBrains：已宣布支持
GitHub：代码仓库开源

ACP 就像编辑器世界的”统一接口”——一次实现，处处可用。

四、Skills：Agent 的技能卡

最后一个，Agent Skills。

这是一个开放规范，定义了如何为 Agent 编写可复用的技能模块。

类比一下

就像游戏角色装备技能卡。

Agent 加载 Skills，获得新能力。

它的结构很简单

1 2	skill-name/ └── SKILL.md # 必需：描述 + 使用说明

SKILL.md 是一个 YAML + Markdown 文件：

---
name: pdf-processing
description: |
  提取 PDF 文本、填写表单、合并文件。
  当用户提到 PDF 或文档处理时触发。
---

# PDF Processing Skill

[给 Agent 的使用说明]

核心能力

Skills 支持三种能力：

能力	说明
触发识别	通过 description 中的关键词，Agent 自动判断何时激活该技能
执行指导	SKILL.md 正文提供详细的执行步骤和注意事项
工具预授权	`allowed-tools` 字段可预批准特定工具，减少确认步骤

模型选择机制

Skills 还可以建议使用特定模型：

---
name: code-review
description: 专业的代码审查技能。
metadata:
  recommended_model: claude-3-opus
  reasoning: 需要强大的代码理解和分析能力
---

这让 Agent 能够根据任务特性，选择最适合的模型：

代码审查 → 推荐 Claude 3 Opus（强推理）
快速总结 → 推荐 GPT-4o-mini（低成本）
图像理解 → 推荐 GPT-4 Vision

为什么重要？

可分享：写好的技能可以发给社区
可复用：一个技能多个 Agent 都能用
可积累：技能库会越来越丰富
成本优化：根据任务选模型，避免大材小用

五、四大协议如何协作？

看到这里你可能有点晕。

四个协议，到底谁连谁？

来一张简化版的关系图：

用户
  │
  ↓
编辑器 ──ACP──→ 编码 Agent
  │                │
  │              MCP
  │                ↓
  │            数据/工具
  │                │
  │              A2A
  │                ↓
  │            其他 Agent
  │                │
  └────────────── Skills
                     ↓
                  技能库

一个典型的开发者工作流：

用户在编辑器里写代码（Zed、Cursor、JetBrains）
编辑器通过 ACP 调用 Agent（”帮我重构这个函数”）
Agent 通过 MCP 读取代码仓库、调用工具
Agent 通过 A2A 与其他 Agent 协作（比如让另一个 Agent 做代码审查）
Agent 加载 Skills 获得特定能力（比如某个框架的专家技能）

用一句话总结：

协议	解决的问题
MCP	Agent 连数据
A2A	Agent 连 Agent
ACP	编辑器连 Agent
Skills	Agent 学技能

四个协议，四层连接。

缺一不可。

这意味着什么？

对普通用户

更智能的 AI 助手。

一次配置，处处可用。

你的 Agent 能读日历、查邮件、写代码，还能和其他 Agent 协作。

对开发者

新的机会正在涌现。

MCP Server 开发者生态
Skills 创作者经济
Agent 间协作应用

掌握协议 = 掌握 Agent 时代的”HTTP”

对行业

从”孤岛 Agent”到”互联生态”。

2023 年，我们在用单一聊天机器人。

2026 年，Agent 已经能互相协作、共享技能、连接任意数据源。

标准化正在加速这个过程。

写在最后

回到小天的问题：

“为什么没有统一标准？”

现在有了。

而且不止一个——MCP、A2A、ACP、Skills 各司其职。

它们正在共同构建 Agent 时代的协议联邦。

就像 TCP/IP 统一了互联网，HTTP 统一了 Web。

这些协议，正在统一 AI Agent 的连接方式。

协议标准化，是 Agent 从玩具变成工具的关键一步。

延伸阅读：