9000 多个 Issue 压过来，OpenClaw 怎么用 AI 把维护队列救回来

为什么大项目最后都卡在 Issue 队列上
它不是自动关单，而是一条保守的维护流水线
它到底关什么，放过什么
真正值钱的，不是模型，是并行和审计
模型重要，但还不是最关键的东西
这件事真正打到痛点的地方
最后说透四点
参考文献

本文首发地址 https://h89.cn/archives/582.html

开源项目做到后面，最容易把人拖垮的，往往不是写代码，而是清 Issue。

你以为维护者最怕的是线上事故？很多时候不是。真正磨人的，是早上打开 GitHub，先看到几千个没处理的 issue 和 PR，红点一片，根本不知道该从哪下手。

ClawSweeper 抓人的地方，也不是“AI 一键关 Issue”这种热闹标题，而是它把这件只能靠人硬扛的脏活，做成了一条能审计、能回滚、能长期跑的流水线。

公开仓库里的审计数据显示，ClawSweeper 曾对 openclaw/openclaw 扫出 9136 个 open item、92 页结果。这已经不是“顺手清理一下”的量级，而是典型的开源维护基础设施问题。

封面配图

为什么大项目最后都卡在 Issue 队列上

Issue 积压最麻烦的地方，不是数字难看，而是它会直接破坏协作效率。

新贡献者看到几千个未处理条目，第一反应不是“这个项目真火”，而是“维护者还看得过来吗？”
同一个 bug 被重复提十几次，维护者每次都得重新翻历史、核对版本、确认是否已修复。
很多条目其实早就过时了，只是一直没人有精力逐个确认、逐个解释、逐个关闭。

ClawSweeper 干的就是这件事：不替维护者拍板，先把队列清出来，把值得人处理的东西筛出来。

做过开源维护的人对这种感觉都不陌生。真正让人头疼的，往往不是修 bug 本身，而是你点开通知以后，先要在一堆重复、陈旧、说不清的条目里扒半天，最后还不一定能动手。

它不是自动关单，而是一条保守的维护流水线

ClawSweeper 的设计很克制。

从官方 README 看，它的工作流大致是这样：

先扫描目标仓库的 open issue 和 PR。
规划器把条目分配给多个 review shard 并行处理。
每个条目都会生成一份 Markdown 记录，落在 records/<repo-slug>/items/<number>.md。
记录里会写清楚决策、证据、建议评论、运行元数据，以及 GitHub snapshot hash。
默认只生成提案，不直接关闭；真正的 close 动作要在后续 apply 阶段执行。

关键点就一句话：AI 先出结构化提案，人再决定执不执行。

README 写得很清楚：手动 review run 即使传了 apply_closures=true 也只是 proposal-only；真要应用既有提案，得单独走 apply 流程。这种慢半拍，不是拖沓，是安全阀。

这种设计我自己很认同。批量动作一旦能“一键执行”，系统离翻车通常也就不远了。慢半拍，不丢人；误关一批高价值 issue，才是真的麻烦。

它到底关什么，放过什么

ClawSweeper 不是“旧 Issue 全关掉”。它的公开规则，比很多新闻稿写得严得多。

官方文档列出的典型 close 场景包括：

问题已经在 main 分支解决
当前代码上无法复现
这个需求更适合去 ClawHub 这类插件/技能仓库，而不是核心仓库
描述信息太少，无法形成可执行动作
超过 60 天、且仍然缺少足够信息验证的 stale issue

同时，它还有几层明确的刹车：

带保护标签的条目不会被提议关闭
maintainer authored 的条目会被排除
apply 前还会重新检查快照，避免条目状态变化后误关
关闭动作和评论同步是分开的，评论可以更新，关闭依然要走更严格的 apply 审核

很多人一看到“AI 清理 Issue”就担心误杀。这个担心没错。但 ClawSweeper 公开出来的机制，更像“AI 审核员 + 人工签字”，不是“AI 法官直接判决”。

说白了，维护者怕的从来不是工作量大，而是半夜回头看，发现自己把真正有价值的反馈当垃圾扫掉了。

真正值钱的，不是模型，是并行和审计

这套系统最像工程的地方，不是用了大模型，而是把维护动作做成了可观测流水线。

README 里能看到几个很硬的细节：

一次 review 计划可以铺到 100 个 shards、500 个 items
新 issue 和最近活跃的条目会走更高频的 hot-intake 通道
审计命令会检查 live GitHub 状态和本地记录是否漂移
Audit Health 会单独刷新，专门报告 missing open records、reopened archived records、stale reviews 等问题

ClawSweeper 要解决的，不是“模型能不能读懂 issue”，而是另一个更现实的问题：模型输出以后，怎么把它接进一条长期可运行的运维链路。

没有这些审计和回放能力，AI 关 10 个 issue 可能是惊喜，关 1000 个 issue 大概率就是事故源。

这种事谁做过批处理谁都知道。小规模时靠感觉还能兜住，一旦上千条，靠“我觉得没问题”基本等于等着出事。

模型重要，但还不是最关键的东西

很多讨论喜欢盯着 GPT-5.4 这种型号名看，但从公开 CHANGELOG 看，ClawSweeper 后续已经切到 GPT-5.5 + high reasoning。这反而说明一件事：模型版本会变，真正留下来的不是模型名，而是流程设计。

大模型在这里承担的工作，主要有三类：

读懂 issue/PR 的上下文
对照仓库现状给出 close 或 keep-open 建议
生成一份可审阅、可追责的结构化结论

但真正让它能在大仓库里落地的，是那些很土、但绕不过去的东西：分片、重试、快照校验、审计、状态机、人工审批。

这些东西没什么标题感，但它们决定这玩意能不能上线。

很多 AI 项目死就死在这里：demo 很顺，真接到生产流程里，全是脏状态、竞态、限流和回滚问题。代码看着不性感，活却全在这些地方。

这件事真正打到痛点的地方

ClawSweeper 最有意思的，不是“AI 替代维护者”，而是它证明了另一件事：开源维护里最先被 AI 接管的，不是创造性工作，而是高噪音、低杠杆、强流程性的治理工作。

维护者最宝贵的，不是点关闭按钮的手速，而是判断这个问题值不值得继续追、这个 PR 会不会埋坑、这个需求是不是该进主仓。AI 先把脏活干完，人把关键判断握在手里，这个分工是对的。

这也是我觉得它有价值的原因。真正稀缺的不是“有人帮你点按钮”，而是有人先把噪音压下去，让你把脑子留给更难的判断。

当然，风险也不是没有。

如果仓库把“批量 close”这件事做得过于丝滑，社区很容易产生被机器打发的感觉。尤其对第一次提 issue 的用户来说，被自动评论然后关闭，体验不会太好。

这个分寸很难拿。维护者想提效，贡献者想被认真对待，这两件事天然就有张力。谁做过社区都知道，流程再对，语气和节奏不对，一样会伤人。

所以 ClawSweeper 最值得学的，不是“自动化”三个字，而是它的克制：提案先行、证据留档、关闭分阶段、审计单独跑、保护规则写死。

最后说透四点

AI 在开源治理里最现实的角色，是高级分诊系统，不是最终裁判。
越是高风险动作，越要拆成 review 和 apply 两段。 先出提案，再执行动作，这是大规模自动化的基本纪律。
模型能力解决的是“看懂”，工程系统解决的是“敢用”。 没有审计、快照和回滚，模型再强也不该碰批量关闭。
真正难的不是关 100 个 issue，而是长期稳定地处理 9000+ 条积压而不伤社区。 这才是维护基础设施的门槛。