Agentsop Aider

Other

SOP for terminal-based, git-native AI pair programming with Aider (git work-tree + tree-sitter repo-map + edit-format + human-in-loop REPL). Use when editing code in an existing git repo via an LLM, when you need to converge a change to 2-5 files, pick an edit format that fits the model, run architect+editor mode, or wire an auto-test loop.

Install

openclaw skills install agentsop-aider

Aider SOP — 终端结对编程的操作系统

一句话：Aider 是“git 工作树 + tree-sitter 仓库地图 + 编辑格式 + 人类在环 REPL”的四元组。理解这四个原语，剩下的都是配置。

1. 何时激活本技能

下列任一情形成立时，按本 SOP 进入 Aider 工作模式：

任务是编辑已有 git 仓库里的代码（不是从零起项目）。
你能把改动范围收敛到 2–5 个文件，或愿意先用 /ask 让模型借助 repo-map 把范围找出来。
你需要逐步可回滚的修改历史（每次编辑一个 commit，/undo 一步回退）。
你在终端里工作（tmux / 远程 ssh / CI）；或者你在写一个把 Aider 当子进程驱动的 agent。
你关心编辑格式对模型质量的影响（diff / udiff / whole / patch 的选择问题）。
你需要 BYOM（自带模型），跑本地 LLM 或非主流厂商。

不应激活的反面信号：见 §6 反模式与边界。

2. 核心心智模型

2.1 四个原语

+------------------+   +------------------+   +------------------+   +------------------+
| 1. Git working   |   | 2. Tree-sitter   |   | 3. Edit format   |   | 4. REPL loop     |
|    tree          |   |    repo-map      |   |    (wire proto)  |   |    (你在环里)    |
|                  |   |                  |   |                  |   |                  |
| - per-edit       |   | - symbol-level   |   | - diff / udiff   |   | - /ask /code     |
|   commit         |   |   summary        |   |   / whole /      |   |   /architect     |
| - /undo          |   | - PageRank over  |   |   patch          |   | - 每轮人手确认   |
| - dirty 文件     |   |   import graph   |   | - 模型适配选择   |   | - 不自主         |
|   先 commit 再编 |   | - 动态预算       |   | - JSON 是反模式  |   |                  |
+------------------+   +------------------+   +------------------+   +------------------+

四者缺一不可：

去掉 git → 失去回滚与审计；
去掉 repo-map → 大仓库里 LLM 找不到正确文件（SWE-Bench Lite 上 repo-map 让 Aider 70.3% 命中正确文件 [aider.chat/2024/05/22/swe-bench-lite.html]）；
用错 edit format → 出现“lazy coding”、SEARCH 块找不到、JSON 句法破坏（udiff 在 GPT-4 Turbo 上把 refactor 基准从 20% 拉到 61% [aider.chat/2023/12/21/unified-diffs.html]）；
放弃 REPL → 退化为自主 agent，但 Aider 在 SWE-Bench 上恰好证明“人在环 + 多次尝试”比纯自主链路更稳。

2.2 LLM 看到的上下文分三层（优先级递减）

层	内容	谁能改
系统提示 + 编辑格式说明	Aider 固化	Aider
只读上下文	repo-map + `/read` 文件 + CONVENTIONS.md	你（通过 `--read`）
读写上下文	`/add` 的文件	LLM 只能编辑这里的文件

铁律：LLM 只允许编辑 /add-ed 的文件。这是 Aider 的安全边界。模型“改错了文件”几乎总是因为该文件没 /add 或你 /add 了太多无关文件。

2.3 上下文预算（25k 信号阈）

"Above about 25k tokens of context, most models start to become distracted." [aider.chat/docs/troubleshooting/edit-errors.html]

把这条当硬约束：超过 25k tokens，编辑准确率断崖式下降。/tokens 持续监控。

2.4 Repo-map 不是 RAG

repo-map 是 tree-sitter 提取的符号清单（类、函数、签名），用 PageRank 在源文件依赖图上排序，塞给 LLM 当地图。这不是 embedding 检索。

为什么不用 embeddings：

LLM 能读签名，但读不懂向量。
不需要维护索引/重建/失效；代码改了下次自动重生成。
/map 可以打印出来人工审计，向量做不到。

预算是动态的：你不 /add 任何文件时，map 占用大；/add 了正确文件后，map 自动缩小，省下的 token 给真正的代码。

2.5 编辑格式是“模型适配问题”，不是“用户偏好”

格式	谁用	强项	弱项
`whole`	弱模型 / GPT-3.5 / 应急回退	解析最稳，无 merge 错误	贵；4k 输出上限会截断
`diff` (SEARCH/REPLACE)	GPT-4o, Sonnet, 多数强模型	token 高效	SEARCH 块必须字节匹配
`diff-fenced`	Gemini 系列	路径放在 fence 内	非主流
`udiff`	GPT-4 Turbo (1106)	模仿 patch 程序的严格性，降低 laziness	提示更重
`patch`	GPT-4.1 (OpenAI patch 协议)	多动作鲁棒	模型特定
`editor-diff` / `editor-whole`	architect 模式的 editor 子模型	提示更瘦，专注编辑	仅在 architect 下有意义

Aider 已经对常见模型选好默认值；只有出现编辑错误时才覆盖。

⇒ 不要把代码编辑包进 JSON tool-call。所有模型在 Aider 的实测里都因此变差，包括 Sonnet（详见 §5 案例 6 与引文）。

3. SOP 工作流

Phase 1 — Bootstrap（每次会话开始）

# 0. 在 git 仓库根目录。stash 或 commit 在途修改。
git status

# 1. 选模型（榜单当前前列：gpt-5, claude-3.7-sonnet, o3-pro, gemini-2.5-pro）
#    [aider.chat/docs/leaderboards/]

# 2. 最小启动 — 让 repo-map 帮 LLM 自己找路
aider

# 3. 范围已知 — 直接预加 + 风格文件
aider src/auth.py tests/test_auth.py --read CONVENTIONS.md

# 4. 强思考 + 廉价编辑（architect 模式）
aider --architect --model o1-preview --editor-model gpt-4o

# 5. 自动测试回路
aider --test-cmd "pytest -x" --auto-test

# 6. 巨型 monorepo
cd packages/feature-foo && aider --subtree-only
# 并维护 .aiderignore

Phase 2 — 收敛范围（`/add` 纪律）

不知道改哪个文件？
  → /ask which files implement <feature>?     (LLM 用 repo-map 回答)
  → /add 它命名的文件（只加这些）

知道改哪个文件？
  → 启动时 CLI 直接传，或 /add path/to/file.py

需要参考但不允许改的文件（schema, config, conventions）？
  → /read path/to/ref.md

铁律重申：少 /add，敢 /drop。/tokens 看现状。

Phase 3 — 讨论再动手（`/ask` → `/code`）

> /ask 当前的 auth 怎么实现？如果改成 JWT 会有什么破坏？
< [模型基于 repo-map + 已 /add 的文件作答]

> /ask 那我们用 PyJWT 还是 authlib？给出权衡。
< [...]

> /code 按刚才讨论的方案，把 sessions 改成 JWT。
< [模型给出 diff]
[Aider 自动应用 → 自动 git commit]

> /test pytest
< [失败时模型看到输出并尝试修复]

"Break your goal down into bite sized steps. Do them one at a time." [aider.chat/docs/usage/tips.html]

Phase 4 — Architect 模式（reasoning ≠ editing）

何时开启：你最好的 reasoner 编辑能力差（典型：o1-preview 单独跑 79.7%，搭配 Sonnet 当 editor 拉到 82.7% [aider.chat/2024/09/26/architect.html]）。

组合	Polyglot Pass@2	备注
o1-preview (architect) + o1-mini (editor, whole)	85%	SOTA 当时；慢，不适合交互
o1-preview + Sonnet	82.7%	"entirely practical"
Sonnet + Sonnet	80.5%	比单跑 77.4% 高
GPT-4o + GPT-4o	75.2%	比单跑 71.4% 高

启用：--architect 或 /architect。Aider 自动把 editor 切到 editor-diff / editor-whole。

Phase 5 — 验证（lint / test / run）

/lint                  # 默认 --auto-lint 已开
/test pytest -x        # 失败时输出回填到 chat
/run npm run typecheck # 输出可选择性回填
/diff                  # 看上一轮的 diff

"Aider will try and fix any errors if the command returns a non-zero exit code." [aider.chat/docs/usage/lint-test.html]

formatter 注意：把会重写文件并返回非零的 formatter 包装在双跑脚本里（第一遍 format，第二遍验证）。

Phase 6 — 上下文卫生

症状	操作
`/tokens` > 25k	`/drop` 不再需要的文件
话题切换	`/clear`（保留文件，清历史）
想全新开始	`/reset`（丢文件 + 清历史）
模型反复改错文件	`/ls` 检查；`/drop` 多余的；`/add` 缺的
反复 edit format 错误	`/clear`；换模型；`--edit-format whole` 兜底

Phase 7 — 收尾

git log --oneline 看一次会话的提交链。
想压成一个 feature commit：git rebase -i HEAD~N（先保留中间 commit 当 undo 栈，最后压）。
提 PR — 提交信息已经是 Conventional Commits 风格。

4. 操作模型（命令速查）

源：[aider.chat/docs/usage/commands.html]

/add <files>      把文件加入 chat（LLM 可编辑）
/read <file>      加为只读（LLM 不能编辑）
/drop <files>     从 chat 移除
/ls               列出已知文件 + 标注哪些在 chat 里
/ask <q>          只讨论，不动文件
/code <req>       明确要求改代码（不加前缀也行）
/architect <req>  双模型 architect+editor
/model <name>     切换主模型
/clear            清 chat 历史（保留文件）
/reset            丢文件 + 清历史
/tokens           当前 token 占用
/map              打印当前 repo-map
/diff             上一轮的 diff
/undo             回退最近一次 Aider commit
/commit           为 chat 外的改动生成 commit
/run <cmd>        跑命令，可选回填输出（别名 !）
/test <cmd>       跑测试，失败时回填
/web <url>        抓网页转 markdown 进 chat
/copy             复制最后一条回复
/help <q>         关于 Aider 本身的问题

CLI 关键标志：

--model X                 主模型
--editor-model Y          editor 子模型（architect 用）
--edit-format whole|diff|udiff|patch
--editor-edit-format ...  editor 子模型的格式
--architect               进入 architect 模式
--read FILE               只读上下文（可多次）
--map-tokens N            repo-map 预算；N=0 关闭
--subtree-only            仅本子目录 + 子树
--auto-lint / --no-auto-lint
--test-cmd CMD --auto-test
--no-auto-commits         关掉自动提交（不建议）
--no-git                  完全脱 git（失去安全保障）
--message "..."           一次性非交互模式（脚本/agent 用）
--yes                     全部确认（脚本/agent 用）

配置文件：.aider.conf.yml（持久 CLI 默认）、.aiderignore（排除 repo-map 路径）、CONVENTIONS.md（用 --read 加载）。

5. 困境决策案例 (Examples / Scenarios)

案例 1 — “模型一直改错文件”

触发：LLM 改的不是你想改的文件，或编造路径。

诊断：LLM 只能安全编辑 /add 的文件。要么目标没 /add，要么 /add 太多导致干扰。

决策规则：

/ls 看现状。
缺目标 → /add path/to/target.py。
太多文件（>4–5 或 tokens > 25k）→ /drop 无关的。
不知道哪个文件 → /ask which file implements X?，让 repo-map 替你答。

为什么有效：/add-ed 文件就是写集合（write-set）。repo-map 只是可读地图，不是写集合。

案例 2 — “大仓库里上下文炸了”

触发：tokens 涨到 25–50k+，响应被截断，模型在 monorepo 上明显变笨。

决策规则（从最便宜的做起）：

步	动作
1	`/tokens` 看占用分布
2	`/drop` 不再需要的文件
3	`/clear` 清聊天历史（保留文件）
4	`--map-tokens 1024`（或弱模型 `0`）
5	monorepo：进子目录 + `--subtree-only`；加 `.aiderignore`
6	拆任务：每个子任务一个会话

关键认知：不要“为了保险全 /add”。SWE-Bench 数据，只靠 repo-map Aider 仍然 70.3% 选对文件 [aider.chat/2024/05/22/swe-bench-lite.html]。

案例 3 — “diff 格式不停 hallucinate / SEARCH 块找不到”

触发：Aider 报 “SEARCH block not found in file”。

诊断：模型给的 SEARCH 文本和文件字节不匹配（空白、前次失败后状态漂移、纯臆造）。

决策规则：

/tokens — 接近 25k 时合规率下降。
/drop + /clear 减负。
升级模型；弱模型“更容易违背系统提示” [aider.chat/docs/troubleshooting/edit-errors.html]。
兜底格式：--edit-format whole。贵但稳。
试 --architect —— 双步流程对“执行编辑指令”的依从性更高。

历史教训：GPT-4 Turbo 上 unified-diff 把 refactor 基准从 20% 拉到 61%，并把 “lazy comment” 砍到 1/3 [aider.chat/2023/12/21/unified-diffs.html]。说明 格式工程的边际收益经常高于换模型。

案例 4 — “architect 模式值得花这个钱吗？”

触发：硬推理任务；你有 o1/o3（强 reasoner，但编辑差）。

决策规则：

情况	建议
reasoner 编辑也干净（GPT-4o, Sonnet）	不开 architect。单跑就行
reasoner 编辑差（o1-preview 单跑 79.7%）	开 architect：o1-preview + Sonnet → 82.7%
追 SOTA、能等	o1-preview + DeepSeek/o1-mini whole → 85%（慢，"probably not practical for interactive use"）
例行编辑	单跑更快更省

反直觉点：连 Sonnet 自配 editor 也涨（77.4 → 80.5%）。但 +3pp 是否值翻倍的 token 成本，取决于场景。

案例 5 — “Sonnet 写超长被 4k 截断”

触发：Claude 3.5 Sonnet 回复在编辑中段截断。

诊断：Sonnet 倾向写太多——整文件 SEARCH/REPLACE 而不是最小 diff [aider.chat/2024/07/01/sonnet-not-lazy.html]。

决策规则：

升级 Aider；它已经支持 “multiple 4k token responses... seamlessly combines them” 并加了精简提示。修复后 Sonnet 的 refactor 基准 55.1 → 64.0%。
还截断时，手动追加：“Make minimal SEARCH/REPLACE blocks. Do not quote unchanged sections.”

案例 6 — “该用 JSON tool-call 包代码吗？”

触发：自建 agent 包 Aider 时考虑结构化 tool-call。

决策规则：不要把代码包进 JSON tool-call。

"All of the models did worse on the benchmark when asked to return code in a structured JSON response." [aider.chat/2024/08/14/code-in-json.html]

即便用 OpenAI strict mode 强制 JSON 合法，JSON 里的代码本身也劣化（更多 SyntaxError / IndentationError）。若 harness 必须 tool-call，把代码塞单一字符串字段，并预期质量损失。

6. 反模式与边界

不要用 Aider 的场景

场景	替代
从零起项目（无 git history、无现有代码）	Cursor 一类，或纯 LLM 对话
跨千个文件的机械重构	先用 sed / AST 工具 / IDE 重构；Aider 收尾语义部分
不能用 git 的工作流（Perforce-only、二进制资产）	别用 Aider；它的安全保障建立在 git 之上
需要 IDE/浏览器感知（实时 diagnostics、devtools）	Cline / Continue / Cursor — Aider 看不到 IDE
完全自主的 ticket→PR	OpenHands / Devin — Aider 是人在环设计

常见错误

多 /add 求保险——反而干扰模型。/drop 才是常态操作。
忽略 repo-map——以为“模型不知道”就乱加文件。/map 看一下它已经知道什么。
architect 模式用弱 editor——再好的 reasoner，editor 不会写格式也白搭。Sonnet / DeepSeek / GPT-4o 才是合格 editor。
不 /clear——长会话历史漂移会让模型“记住错的东西”。话题切换就清。
关 auto-commit “保历史干净”——失去 /undo 栈。正确做法是事后 git rebase -i 压。
CONVENTIONS.md 不写——风格（用 httpx 不用 requests、加 type hints）反复纠正不如一次写进 --read CONVENTIONS.md；formatter 返回非零会搞砸 auto-lint，用双跑脚本包一下。

Aider 有意不做的事（硬边界）

不渲染 IDE（保持终端纯净）。
不维护 embedding 索引（repo-map 按需重生成）。
默认不自主（人在环是设计哲学，Paul 论证过这是生产力优势）。
一会话一仓库（跨仓库需要更高层编排）。
无跨会话长期记忆（持久化靠 CONVENTIONS.md、.aider.conf.yml、git history 本身）。

7. 生态对照

	Aider	Cline	Cursor	Continue	OpenHands
表面	终端 REPL	VS Code 扩展	闭源 IDE（VS Code fork）	VS Code + JetBrains 扩展	Web UI + Docker 沙箱
开源	Apache 2.0	是	否	是	MIT
编辑原语	diff/udiff/whole 文本 + git commit	tool-call + 每步人审	内嵌 Composer 多文件	Edit/Chat/Agent/Autocomplete	自主 plan→edit→test→PR
上下文	tree-sitter repo-map + 选择性 /add	按需 tool-call 读	全仓库索引	RAG	agentic 读
人审	每轮（`/undo` 兜底）	每个 tool-call	每次 Composer apply	每次 edit	无
Git 集成	原生（每编辑一 commit）	通过终端工具	手动	手动	沙箱里 PR
BYOM	是（100+，经 LiteLLM）	是	受限	是	是

来源：[frontman.sh/blog/best-open-source-ai-coding-tools-2026]、[cline.bot/blog/top-9-cursor-alternatives-in-2025]、[opensourcealternatives.to]、[shakudo.io/blog/best-ai-coding-assistants]。

何时选 Aider 而非其他

你住在终端：tmux + vim/emacs + Aider 是经典栈，零 IDE 切换。
你要 git-clean 历史：per-edit commit 自动产出可审计提交链。
你在写 agent：--message、--yes、配置文件 → 子进程驱动友好。
你关心编辑格式工程：Aider 在 udiff、architect、JSON-vs-text 上有最多公开实验数据。
你要确定性上下文：tree-sitter 地图可 /map 检查、可复现、无向量库依赖。
任务已收敛：你知道 2–5 个目标文件。

反过来选别的

Cline：要 VS Code 内每个编辑 / shell 命令的逐步确认。Aider 是事后 /undo；Cline 是事前 approve。
Cursor：要内嵌 diff 浮层、ghost-text 自动补全、视觉化文件上下文指示。
Continue：要跨 IDE（VS Code + JetBrains）一致体验，要 autocomplete + chat + agent 一体。
OpenHands：要自主ticket→PR；issue 进、PR 出。Aider 没瞄准这场景。

Aider 留给 agent-coder 的研究遗产

即便你选别的前端，Aider 的公开实验是这些决定的参考：编辑格式选择（GPT-4 Turbo refactor 20%→61%）、repo-map 战胜 RAG（SWE-Bench Lite 70.3%）、architect+editor 拆分（79.7%→85%）、JSON-vs-text 劣化、lazy-coding 缓解——具体数据见前文各节。

引用源

[aider.chat/docs/usage.html] [aider.chat/docs/usage/tips.html] [aider.chat/docs/usage/modes.html] [aider.chat/docs/usage/commands.html] [aider.chat/docs/usage/conventions.html] [aider.chat/docs/usage/lint-test.html]
[aider.chat/docs/repomap.html] [aider.chat/docs/more/edit-formats.html] [aider.chat/docs/git.html] [aider.chat/docs/faq.html]
[aider.chat/docs/troubleshooting/edit-errors.html] [aider.chat/docs/troubleshooting/token-limits.html]
[aider.chat/docs/leaderboards/]
[aider.chat/2023/12/21/unified-diffs.html] [aider.chat/2024/04/09/gpt-4-turbo.html] [aider.chat/2024/05/22/swe-bench-lite.html] [aider.chat/2024/07/01/sonnet-not-lazy.html] [aider.chat/2024/08/14/code-in-json.html] [aider.chat/2024/09/26/architect.html]
[aider.chat/HISTORY.html]
[github.com/Aider-AI/aider]（生态对照来源见 §7）

Agentsop Aider

Install

Aider SOP — 终端结对编程的操作系统

1. 何时激活本技能

2. 核心心智模型

2.1 四个原语

2.2 LLM 看到的上下文分三层（优先级递减）

2.3 上下文预算（25k 信号阈）

2.4 Repo-map 不是 RAG

2.5 编辑格式是“模型适配问题”，不是“用户偏好”

3. SOP 工作流

Phase 1 — Bootstrap（每次会话开始）

Phase 2 — 收敛范围（/add 纪律）

Phase 3 — 讨论再动手（/ask → /code）

Phase 4 — Architect 模式（reasoning ≠ editing）

Phase 5 — 验证（lint / test / run）

Phase 6 — 上下文卫生

Phase 7 — 收尾

4. 操作模型（命令速查）

5. 困境决策案例 (Examples / Scenarios)

案例 1 — “模型一直改错文件”

案例 2 — “大仓库里上下文炸了”

案例 3 — “diff 格式不停 hallucinate / SEARCH 块找不到”

案例 4 — “architect 模式值得花这个钱吗？”

案例 5 — “Sonnet 写超长被 4k 截断”

案例 6 — “该用 JSON tool-call 包代码吗？”

6. 反模式与边界

不要用 Aider 的场景

常见错误

Aider 有意不做的事（硬边界）

7. 生态对照

何时选 Aider 而非其他

反过来选别的

Aider 留给 agent-coder 的研究遗产

引用源

Phase 2 — 收敛范围（`/add` 纪律）

Phase 3 — 讨论再动手（`/ask` → `/code`）