深色模式
什么是 MCP
MCP (Model Context Protocol) 是 Anthropic 在 2024 年推出的开放协议,让 AI 编辑器(Claude Desktop / Cursor / 其他)可以调用外部工具,就像浏览器有插件一样。
AgileShot 内置一个 MCP Server,把截图能力作为工具暴露出去 — 这意味着:
- Claude Desktop 可以自己截屏 — 你说"截一下我现在的屏幕",它真的截图
- Cursor 可以让 AI 看你正在做什么 — 不用手动复制图,AI 主动获取上下文
- AI 可以在你屏幕上画标注 —
annotate_image工具让 AI 直接画矩形 / 箭头 / 文字
这是 AgileShot 独占的差异化能力,目前没有任何其他截图工具实现了这一点。
工作原理
┌──────────────────┐ JSON-RPC ┌──────────────────┐
│ Claude Desktop │ ◄────────────► │ AgileShot │
│ / Cursor │ over stdio │ MCP Server │
└──────────────────┘ └──────────────────┘
│ │
│ "截一下活动窗口" │
│ ───────────────────────────────────►│
│ │ 调用 screenshot_active_window
│ │ → 把图保存到 SQLite + 返回 base64
│ ◄───────│
│ 收到图片 → AI 分析 → 给用户答复 │
▼ │整个过程不需要你做任何操作 — AI 自己截图、自己拿数据、自己回答。
9 个工具一览
| 工具名 | 用途 |
|---|---|
screenshot_fullscreen | 截取全屏(所有显示器拼接或指定屏) |
screenshot_region | 截取指定坐标矩形 |
screenshot_active_window | 截取当前活动窗口 |
list_recent_shots | 列出最近 N 张历史截图(返回缩略图 + 元数据) |
get_shot | 按 ID 取出某张完整截图 |
search_shots | 关键词搜索历史(基于 OCR 文本) |
delete_shot | 删除历史截图 |
count_shots | 统计历史数量(可按时间过滤) |
annotate_image ⭐ | 让 AI 直接在图上画 6 类标注(矩形 / 椭圆 / 箭头 / 直线 / 高亮笔 / 文字) |
完整工具签名和参数详见 工具参考。
启动 MCP Server
AgileShot 同时是一个 GUI 应用 和 一个 MCP Server。在 AI 编辑器配置时通过命令行参数启动:
bash
agile-shot.exe --mcp-server加上这个参数,程序不打开 GUI,只在 stdio 上响应 JSON-RPC 2.0 请求。Claude Desktop / Cursor 启动时自动 spawn 这个进程,使用完毕自动回收。
注意: GUI 模式和 MCP 模式可以同时运行(共享 SQLite 历史库)。AI 截的图你在历史面板里也能看到。
典型用例
用例 1: AI 帮你看 bug
你: "我界面好像有个对齐 bug,你帮我看看"
AI: (调用
screenshot_active_window) → 分析 → "你的右侧按钮比左侧偏下 4 像素,看起来是 padding-top 多了"
用例 2: AI 帮你写 alt 文本
你: "把我最近 10 张截图都生成 alt 文本,我要发博客"
AI: (调用
list_recent_shots+ 循环get_shot) → 批量生成
用例 3: AI 帮你在图上标重点
你: "把这张架构图里的数据库节点用红框圈出来"
AI: (调用
annotate_image,指定 type=rectangle, color=red, bbox=[x,y,w,h]) → 输出标注后的图
用例 4: AI 找历史
你: "我上周截的那张关于 Docker 网络的图在哪?"
AI: (调用
search_shots(query="docker network")) → 返回匹配的截图列表
接入指南
- 接入 Claude Desktop — Windows / macOS 配置
- 接入 Cursor — IDE 内置 MCP 客户端配置
- 工具参考 — 每个工具的完整签名、参数、返回值
兼容性
| 客户端 | 兼容状态 | 备注 |
|---|---|---|
| Claude Desktop (Mac / Win) | ✅ 完全兼容 | 官方 MCP 客户端 |
| Cursor | ✅ 完全兼容 | 内置 MCP 支持 (v0.40+) |
| Cline (VS Code) | ✅ 完全兼容 | 内置 MCP 支持 |
| Continue.dev | ✅ 兼容 | 需要 MCP 插件 |
| 自研 LLM Agent | ✅ 标准 JSON-RPC 2.0 | 任何能起子进程通信的 Agent 都能接 |
安全说明
AI 能截到所有屏幕内容
启用 MCP Server 后,接入的 AI 客户端可以截取你当前屏幕的任何内容 — 包括密码框、私聊、银行页面。 请确保:
- 只接入你信任的 AI 编辑器
- 不在敏感操作时开着 MCP
- 关闭时托盘右键 → MCP Server → 停止
