深度解读 MCP,你没看过的「船新版本」

深度探讨 MCP

cover.png

# 普通人能看懂的 MCP 解释

想象一下,你的手机需要连接耳机、充电器或投影仪时,只需要一个 USB-C 接口就能搞定—— MCP 就像 AI 领域的「万能接口」。它让 ChatGPT、Claude 这类 AI 模型不仅能聊天、写诗,还能直接操作现实世界的工具,比如自动发邮件、查数据库、更新任务列表,甚至帮你订机票!通过 MCP,开发者可以像搭积木一样,把各种工具和数据源(如 GitHub、Excel、各种系统的数据)连接到 AI,让 AI 真正帮你干活,而不是只会说话。

# 核心功能与定义

MCP 是由 Anthropic 于 2024 年 11 月推出的开放协议,旨在通过标准化接口实现大语言模型(LLM)与外部数据源、工具的无缝集成。其核心功能包括:

  • 统一通信标准:类比「AI 领域的 USB-Type C 接口」,MCP 为 AI 模型与工具提供通用连接方式,解决传统 API 集成的碎片化问题。

  • 主动执行能力:使 AI 不仅能生成文本,还能直接操控外部工具(如读取文件、发送邮件、查询数据库等),推动 AI 从被动响应转向主动执行。

  • 安全与效率优化:通过预定义协议减少代码定制需求,降低开发门槛,同时确保安全控管。

# 技术架构

# 核心组件

  • MCP Host:这是 AI 应用程序,例如 Claude Desktop 或 IDE、AI 工具,用于启动和管理与外部系统的交互

  • MCP Client:协议客户端,负责与服务器建立连接,并将 LLM 的请求转换为标准化消息

  • MCP Server:轻量级程序,通过标准化协议暴露特定功能,提供功能接口(如文件系统、数据库等),供 AI 调用

# 工作原理

  1. MCP Client 首先从 MCP Server 获取可用的工具列表。
  2. 将用户的查询连同工具描述通过 Function calling 一起发送给 LLM。
  3. LLM 决定是否需要使用工具以及使用哪些工具。
  4. 如果需要使用工具,MCP Client 会通过 MCP Server 执行相应的工具调用。
  5. 工具调用的结果会被发送回 LLM。
  6. LLM 基于所有信息生成自然语言响应。
  7. 最后将响应展示给用户。

与 RAG(检索增强生成)和 AI Agent 的区别在于:

  1. RAG 仅辅助回答问题,而 MCP 支持实际操作。
  2. AI Agent 强调自主性,MCP 则专注标准化通信,两者互补。

# 技术突破与优势

动态工具集成:传统 AI 只能调用预定义函数,而 MCP 允许运行时发现新工具(如临时接入 GitHub API),极大提升灵活性。

上下文感知:AI 可跨多步任务保持上下文(例如先查数据库再生成报告),避免传统 RAG 的单次检索局限。

简化流程:简化了 AI 与工具整合流程,例如通过 MCP 调用 Google Drive、Slack 等 Server。

助力生态建设:社区涌现大量教程与开源项目(如 ClickHouse、Blender、Figma 等 Top Server),推动技术普及。

# 当前进展

# 生态爆发与快速普及

  • MCP 发布仅一个季度,已垄断 Agentic AI 中间层,成为 AI 应用与工具/数据源之间的主导协议。

  • MCP Server 数量已接近 5000 个,开发者采用率增速位居开源框架前列。

  • 主流厂商支持:OpenAI 于 3 月宣布其 Agent SDK 支持 MCP,统一接口标准以扩展工具调用能力(如网络搜索、数据分析等);Anthropic 的 Claude 系列模型深度集成 MCP,提升任务执行效率。

# 应用场景扩展

  • 企业级服务:金融、医疗等领域通过 MCP 连接实时数据优化决策。

  • 开发工具:支持浏览器自动化、UI 界面创建、视频字幕提取等开源项目。

  • 多模态与并行计算:结合多链处理技术,提升 AI 任务并行度与响应速度。

# 开发者生态

# 去魅

# 一个 AI 工具共识的协议

MCP Server 并不是像大众媒体宣传的那样,神乎其神,它只是一个具有共识的协议。

如果我们想要实现一个更强大的 AI Agent,例如我们想让 AI Agent 自动的根据服务错误日志,自动搜索相关的 GitRepo,定位到提交 Commit ,最后将结果发送到 IM 工具。

那么我们可能需要创建三个不同的 MCP Server,一个是 Service Log Server,用来查询服务日志;一个是 Git Server,用来搜索 Git 提交;还有一个日志分析 Server(当然也可以直接用 LLM 来做) ,还有一个是 IM Server,用来发送消息。

AI Agent 在用户输入:「我需要查询服务错误日志,将可能引起错误的日志的提交推到相关负责人」 指令后,自行判断需要调用哪些 MCP Server,并决定调用顺序,最终根据不同 MCP Server 的返回结果来决定是否需要调用下一个 Server,以此来完成整个任务。

# 目前的不足

认证鉴权以及精细化权限控制:目前 MCP 还没有任何的权限模型来进行精细化的访问控制,与此同时,MCP 尚未统一安全标准,企业需自行开发加密模块(如 Composio 的预建方案:https://mcp.composio.dev) (opens new window)

生态碎片化:有些行业需定制协议扩展,导致适配成本上升。

开发者体验待增强:开发者需要解决跨客户端兼容性、调试不顺畅等问题,尚未出现统一层面的开发工具来保持标准化的开发体验。

# MCP 协议的未来

目前 MCP 处于协议层演变的初期。目前仍然存在许多需要解决的问题。

# 云托管与多租户支持

尽管 MCP 已支持 AI Agent 与工具的分布式协作,但在 SaaS 化场景中,需要实现多租户架构以支持共享服务器的并发访问。虽然远程服务器部署可作为提升接入效率的过渡方案,但企业级用户更关注数据面与控制面的隔离部署能力。构建支持大规模集群部署的自动化运维工具链,将成为推动行业应用的关键要素。

# 认证体系再进化

当前协议缺乏标准化的认证机制,尤其在第三方 API 交互场景中,安全凭证的管理与委派尚未形成统一范式。现有应用主要集中在无需严格认证的本地集成场景。构建三位一体的认证框架势在必行:

  1. 客户端认证:集成 OAuth、API 令牌等标准方案
  2. 工具认证:封装第三方 API 的安全交互接口
  3. 多租户认证:面向企业场景的租户隔离方案

# 更细粒度权限控制

现有权限模型停留在会话级控制,尽管目前最新的 OAuth 2.1 授权流程可确保会话级别的鉴权,但随着 Server 数量指数级增长,凭证管理和会话维护成本急剧攀升。构建支持 RBAC/ABAC 的动态授权体系,实现操作级别的细粒度控制势在必行。

# 网关,未来的新机遇

随着 MCP 方案的不断普及,网关正逐渐演变为一个核心的集中管理平台。类似于 API 网关,它不仅负责身份验证、授权和流量控制,还能智能地选择所需工具,实现请求的精准路由、负载均衡及响应缓存。特别是在多租户环境中,不同用户和代理对权限的需求各不相同,一个标准化的网关能有效简化客户端与服务器的交互,提升整体安全性与系统可观测性,从而使 MCP 部署更灵活、更易扩展。

# Server 服务发现以及注册,智能互联的基石

当前 MCP Server 仍然需要用户手动的去查找和配置,AI Agent 目前也无法动态地发现或适应新的 Server,未来协议可能会推出服务注册与发现能力。

# 总结

MCP 的标准化进程正在加速,为 AI 工具生态的互操作性奠定基础。正如 TCP/IP 协议为互联网发展奠定基石,MCP 正在构建智能系统间的标准化通信层。

目前,基础框架已初步成型,但仍需持续优化与完善。2025 年被视为 MCP 元年,这一年 MCP 将迎来爆发,其发展将决定 AI 生态的扩展与创新方向。未来充满无限可能,值得我们共同期待。

Background Image

作为一名软件工程师,我们一直给各行各业写软件提升效率,但是软件工程本身却是非常低效,为什么市面上没有一个工具可以让研发团队不这么累,还能更好、更快地满足大客户的交付需求?我们是否能够打造一个面向开发者的交付平台呢?我们开源打造 Zadig 正是去满足这个愿望。

—— Zadig 创始人 Landy