Skip to content

什么是 MCP

MCP (Model Context Protocol) 是 Anthropic 在 2024 年推出的开放协议,让 AI 编辑器(Claude Desktop / Cursor / 其他)可以调用外部工具,就像浏览器有插件一样。

AgileShot 内置一个 MCP Server,把截图能力作为工具暴露出去 — 这意味着:

  • Claude Desktop 可以自己截屏 — 你说"截一下我现在的屏幕",它真的截图
  • Cursor 可以让 AI 看你正在做什么 — 不用手动复制图,AI 主动获取上下文
  • AI 可以在你屏幕上画标注annotate_image 工具让 AI 直接画矩形 / 箭头 / 文字

这是 AgileShot 独占的差异化能力,目前没有任何其他截图工具实现了这一点。

工作原理

┌──────────────────┐    JSON-RPC    ┌──────────────────┐
│  Claude Desktop  │ ◄────────────► │  AgileShot       │
│  / Cursor        │   over stdio   │  MCP Server      │
└──────────────────┘                └──────────────────┘
        │                                    │
        │ "截一下活动窗口"                     │
        │ ───────────────────────────────────►│
        │                                    │ 调用 screenshot_active_window
        │                                    │ → 把图保存到 SQLite + 返回 base64
        │                            ◄───────│
        │ 收到图片 → AI 分析 → 给用户答复       │
        ▼                                    │

整个过程不需要你做任何操作 — AI 自己截图、自己拿数据、自己回答。

9 个工具一览

工具名用途
screenshot_fullscreen截取全屏(所有显示器拼接或指定屏)
screenshot_region截取指定坐标矩形
screenshot_active_window截取当前活动窗口
list_recent_shots列出最近 N 张历史截图(返回缩略图 + 元数据)
get_shot按 ID 取出某张完整截图
search_shots关键词搜索历史(基于 OCR 文本)
delete_shot删除历史截图
count_shots统计历史数量(可按时间过滤)
annotate_image让 AI 直接在图上画 6 类标注(矩形 / 椭圆 / 箭头 / 直线 / 高亮笔 / 文字)

完整工具签名和参数详见 工具参考

启动 MCP Server

AgileShot 同时是一个 GUI 应用 一个 MCP Server。在 AI 编辑器配置时通过命令行参数启动:

bash
agile-shot.exe --mcp-server

加上这个参数,程序不打开 GUI,只在 stdio 上响应 JSON-RPC 2.0 请求。Claude Desktop / Cursor 启动时自动 spawn 这个进程,使用完毕自动回收。

注意: GUI 模式和 MCP 模式可以同时运行(共享 SQLite 历史库)。AI 截的图你在历史面板里也能看到。

典型用例

用例 1: AI 帮你看 bug

你: "我界面好像有个对齐 bug,你帮我看看"

AI: (调用 screenshot_active_window) → 分析 → "你的右侧按钮比左侧偏下 4 像素,看起来是 padding-top 多了"

用例 2: AI 帮你写 alt 文本

你: "把我最近 10 张截图都生成 alt 文本,我要发博客"

AI: (调用 list_recent_shots + 循环 get_shot) → 批量生成

用例 3: AI 帮你在图上标重点

你: "把这张架构图里的数据库节点用红框圈出来"

AI: (调用 annotate_image,指定 type=rectangle, color=red, bbox=[x,y,w,h]) → 输出标注后的图

用例 4: AI 找历史

你: "我上周截的那张关于 Docker 网络的图在哪?"

AI: (调用 search_shots(query="docker network")) → 返回匹配的截图列表

接入指南

兼容性

客户端兼容状态备注
Claude Desktop (Mac / Win)✅ 完全兼容官方 MCP 客户端
Cursor✅ 完全兼容内置 MCP 支持 (v0.40+)
Cline (VS Code)✅ 完全兼容内置 MCP 支持
Continue.dev✅ 兼容需要 MCP 插件
自研 LLM Agent✅ 标准 JSON-RPC 2.0任何能起子进程通信的 Agent 都能接

安全说明

AI 能截到所有屏幕内容

启用 MCP Server 后,接入的 AI 客户端可以截取你当前屏幕的任何内容 — 包括密码框、私聊、银行页面。 请确保:

  • 只接入你信任的 AI 编辑器
  • 不在敏感操作时开着 MCP
  • 关闭时托盘右键 → MCP Server → 停止

下一步

让 AI 看到你的屏幕 · 让标注更有温度