Apr 30, 2026

Last updated on May 2, 2026

gstack 对 AI Agent 说对的一件事：角色比提示词更重要

gstack 很容易被误读。

最短的说法是：它是 Garry Tan 的 Claude Code 配置。这句话没错，但会把这个项目说得太小。更准确地说，gstack 是一个开源工作流。它让 Claude Code 不再只是一个聊天机器人，而更像一支小型软件团队。

gstack 在 Claude Code 周围加上了可复用的 skill、slash command、浏览器工具、审查循环和运行规则。它不把规划、设计、实现、审查、测试、安全、文档和发布全塞进一段长对话里交给同一个编码 agent。它把工作拆成可以命名的责任单元：founder review、engineering review、design review、staff-engineer review、QA、security、release、documentation、browser testing、learning。[1][3]

值得看的地方就在这里。gstack 重要，不是因为每个人都应该复制 Garry Tan 的配置。它有用，是因为它展示了严肃的 AI 编程工作流正在往哪里走：少一点魔法提示词，多一点运行纪律。

Garry Tan 是谁

Garry Tan 是 Y Combinator 的 President 和 CEO，也是 YC 的 General Partner。他共同创办了 Initialized Capital 和 Posterous，更早之前曾在 Palantir 担任早期设计师和 engineering manager。[9]

这个背景很关键。Y Combinator 的 CEO 公开自己的 AI 编程工作流，创始人和技术操作者自然会看。但更重要的是他看问题的方式。

这不只是让 Claude 写更多代码。模型已经能产出大量代码之后，真正的问题会浮出来。产品想法值不值得做，谁判断？架构谁检查？设计变得粗糙，谁发现？真实浏览器路径谁测试？安全和发布谁负责？

这种 founder/operator 视角，让 gstack 和普通的 Claude Code 配置不一样。

gstack 是什么

garrytan/gstack 仓库把自己描述为一组 Claude Code skills、slash commands、浏览器工具和工作流模式。README 说，gstack 可以把 Claude Code 变成一支虚拟工程团队：重新思考产品的 CEO，锁定架构的 engineering manager，抓 AI slop 的 designer，发现生产级 bug 的 reviewer，用真实浏览器测试的 QA lead，执行 OWASP 和 STRIDE 审计的 security officer，以及负责交付 PR 的 release engineer。[1]

截至写作时，GitHub API 显示这个仓库大约有 87,400 个 star 和 12,800 个 fork，许可证是 MIT。[2] star 不能证明质量。但它能说明注意力。而这个项目受到关注是有原因的：gstack 把很多 builder 已经遇到的问题打包成了一个具体工作流。

从空白聊天框开始的 AI 编程并不好扩展。模型可以产生很多输出，但输出不等于进展。没有审查关卡时，更多生成代码也可能只是意味着模型默默做了更多决定。

gstack 的 quick-start 流程也说明了这一点。它不是让你从一个巨大的提示词开始。它让你安装系统，运行 /office-hours，运行 /plan-ceo-review，运行 /review，运行 /qa，然后判断这个工作流是否适合你。[1]

这不是提示词库。它是一份有约束力的检查清单。

如果你已经理解了概念，想看实际使用流程，可以读如何使用 gstack：不要把 Claude Code 变得过度复杂。

为什么人们会注意到它

一部分原因很明显：Garry Tan 有分发力。YC 创始人、indie hacker 和 AI 工具圈的人，都会想看看他到底用什么来 ship。

但仅靠影响力解释不了反应。gstack 出现的时间点刚好。开发者已经在用痛苦的方式学到同一个教训：瓶颈不总是代码生成。很多时候，瓶颈是范围控制、审查、测试、产品判断和记忆。

gstack 给这些部分起了名字。/office-hours 是产品压力测试。/plan-ceo-review 是 founder review。/plan-eng-review 是架构审查。/review 是 staff-engineer review。/qa 测试应用。/cso 看安全。/ship 处理发布。/document-release 更新文档。[3]

想法很简单：不要让一个 agent 同时扮演所有人。

给它一个角色。给它一个阶段。给它一个完成标准。

有用的抽象：虚拟工程团队

普通的 AI 编程会话经常从一个模糊请求开始：

Build this feature.

然后模型会自己做产品决策、架构决策、设计决策、测试决策和发布决策。有时能行。但很多时候，结果看起来完成了，底下的假设却是错的。

gstack 试图把这些隐藏决策拉到台面上。

skills 文档把命令映射到专家角色：/office-hours 用来做 YC 风格的产品提问，/plan-ceo-review 做 founder review，/plan-eng-review 做架构审查，/plan-design-review 做设计审查，/review 做 staff-engineer review，/qa 做 QA，/cso 做安全，/ship 做发布工程，/document-release 做技术写作。[3]

这里没有什么神秘的东西。它只是把管理结构写进命令里。

这听起来可能不如“自主 agent”那么刺激，但更有用。真实的软件工作本来就有角色，因为产品品味、架构、实现、QA、安全、文档和发布需要不同判断。当一个 assistant 回复试图包办所有这些事，工作就很难检查。

角色拆开之后，人类有了更好的抓手：

product review 问这个功能是否值得做
engineering review 检查计划是否适合当前系统
design review 看界面和产品感是否有问题
QA 在真实浏览器里测试
security 寻找可避免的风险
release 检查这个变更能不能安全发布

一个提示词也可以提到所有这些事。但工作流能让这些步骤真的发生。

为什么这对 agent 重要

AI 编程的失败模式不只是坏代码。更常见的问题是责任消失。

agent 可以写代码。但产品 framing 谁负责？范围谁收？真实用户路径谁测试？README 过期了谁发现？这个分支能不能 merge，谁判断？

在传统团队里，这些责任分布在人和流程之间。一个人使用 AI 时，如果工作流不把这些责任带回来，它们就会消失。

gstack 把这些责任当成工作的一部分，而不是额外装饰。“virtual engineering team”这个说法可能听起来像品牌话术，但底下的模式很实用：不要一开始就给 agent 一个更大的提示词，而是在合适的阶段给它一个更窄的任务。[1][3]

这也是 gstack 和从 prompt engineering 转向 context engineering、agent operations 的趋势相连的地方。问题不再只是“什么指令能让模型表现更好？”而是“什么结构能防止工作跑偏？”

我们在前几篇文章里讨论过的 GSD，也从另一侧处理同一个问题。GSD 把持久项目状态放进 .planning/、phase、command 和 verification gate。gstack 更强调 specialist role 和 review discipline。系统不同，方向相同：严肃的 agent 工作需要比聊天窗口更多的结构。[7][8]

OpenClaw 视角

gstack 的 OpenClaw 文档很有用，因为它把 gstack 当成方法论，而不是被移植的运行时。[4]

OpenClaw 可以通过 ACP 启动 Claude Code 会话。gstack 可以给这些会话提供 planning discipline 和 specialist review。这个集成故意很轻：没有 daemon，没有 JSON-RPC，没有 compatibility matrix。提示词就是桥。[4]

这对 agent 系统很重要。不是每个工作流都需要变成紧耦合的平台集成。有时有用的层只是可移动的文本：检查清单、审查角色、planning discipline，或者一个告诉 coding agent 应该应用哪种判断的命令。

对于使用 OpenClaw、Hermes、Codex、Claude Code 或其他 agent runtime 的 builder 来说，这部分最值得复制。未来可能不是一个完美的 agent 环境，而更像是一层层叠起来的 orchestrator、coding agent、skill、memory、browser tool 和 review loop。工作流层必须能跨 host 移动。

gstack 的 OpenClaw 文档给了一个简单的路由规则：

简单修改不需要 gstack context
多文件功能可能需要轻量 planning
review、QA 或 security 请求应该调用对应 specialist
更大的 objective 需要更完整的 planning 和 implementation pipeline[4]

这个判断是对的。一行 typo 不应该变成仪式。但严肃的功能开发也不该被当成 typo 处理。

LOC 争议是提醒，不是重点

README 里有很强的生产力主张。它说 Garry Tan 在 2026 年 ship 的 logical code 远多于他 2013 年的 baseline，并链接到一篇关于 LOC controversy 的方法说明。[1][5]

这部分需要谨慎。

代码行数不是质量指标。争议文档自己也直接承认这一点，承认 AI verbosity，并尝试用 logical SLOC 和 deflation assumption 来校正比较。[5] 这比一句粗糙的“AI 让我快了 800 倍”更谨慎。但提醒仍然成立：shipped code volume 不等于 shipped product value。

更值得留下的是工作流。

如果一个人要监督更多 AI 生成的工作，审查结构不是更不重要，而是更重要。输出量上升之后，瓶颈会转移到决定做什么、限制范围、抓错误假设、测试真实行为、保护系统安全、谨慎发布。

这些角色，gstack 给它们起了名字。

该复制什么

错误的教训是：因为它流行，所以把整套 stack 都复制过来。

更好的教训是运行原则：

不要让一个 agent 同时扮演所有人。
给 agent 一个角色、一个阶段、一个完成标准。

对小团队或 solo builder 来说，可以这样做：

在规划功能前做 product review
在实现前做 architecture review
merge 前跑一次单独的 code review
对用户可见的变更做 browser QA
对 auth、payment、upload、permission 相关工作做 security review
把文档更新放进 release，而不是事后再补

这些事不一定需要 gstack。你可以在 Claude Code、Codex、OpenClaw、Hermes skills、仓库的 AGENTS.md，或者一份小检查清单里实现同样的模式。gstack 有用，是因为它把这个模式具体化了。

代价是开销。基于角色的工作流会消耗时间、token 和注意力。小任务里，流程可能比问题本身更麻烦。但在严肃工作里，这不是仪式。这是防止生成代码变成自信漂移的方法。

运行模型

理解 gstack 的最好方式是：

coding agent + explicit roles + review gates + browser/tool feedback + controlled memory

domain-skills 文档也强化了这个方向。gstack 有一套机制，可以保存 agent 后续可复用的站点级笔记，并给这些笔记设置 quarantine、activation、promotion、rollback、deletion 状态。[6] 这很重要。agent 工作流在记住运行细节时会变好，但记忆也需要控制。把每条学到的笔记都注入未来每个会话，原本有用的 context 就会变成 context pollution。

gstack 更大的教训是：agent productivity 正在变成一个 operations 问题。

模型需要 context。工作需要阶段。阶段需要 owner。owner 需要 check。check 需要工具。结果需要被谨慎记住。

所以 gstack 值得研究。

不是因为某一个 slash command。是因为它展示了 coding agent 周围下一层有用结构的形状：product review、engineering review、design review、QA、security、release、documentation、memory。

不是一个巨大的提示词。

而是一个像团队一样运作的工作流。

References

Garry Tan, gstack README
https://github.com/garrytan/gstack
GitHub API, garrytan/gstack repository metadata, checked 2026-04-30
https://api.github.com/repos/garrytan/gstack
Garry Tan, gstack Skill Deep Dives
https://github.com/garrytan/gstack/blob/main/docs/skills.md
Garry Tan, gstack x OpenClaw Integration
https://github.com/garrytan/gstack/blob/main/docs/OPENCLAW.md
Garry Tan, On the LOC controversy
https://github.com/garrytan/gstack/blob/main/docs/ON_THE_LOC_CONTROVERSY.md
Garry Tan, Domain Skills
https://github.com/garrytan/gstack/blob/main/docs/domain-skills.md
FlowHat, What Is GSD (get-shit-done)?
/blog/2026-04-28-what-is-gsd/
FlowHat, How to Actually Use GSD: The Workflow Behind Get Shit Done
/blog/2026-04-29-how-to-use-gsd/
Y Combinator, Garry Tan: YC Partner
https://www.ycombinator.com/people/garry-tan