Get Shit Done: Meta-prompting e spec-driven development que realmente funciona
Get Shit Done: Meta-prompting e spec-driven development que realmente funciona
Sessões longas com agentes de IA têm um problema silencioso: context rot. Quanto mais você usa o agente, mais a qualidade degrada. O contexto vai enchendo, o agente começa a esquecer coisas que vocês discutiram no início, as respostas ficam mais genéricas, os erros mais frequentes.
Eu já passei por isso. Você começa uma sessão animado, o agente entrega código excelente nas primeiras horas, mas depois de umas 10-15 interações, a coisa desanda. Ele sugere soluções que contradizem o que vocês combinaram, propõe refatorações desnecessárias, ou simplesmente perde o rumo do que você queria construir.
O problema não é o modelo. É como a gente gerencia o contexto.
Foi aí que eu descobri o Get Shit Done (GSD).
O que é GSD?
É um sistema leve de meta-prompting, context engineering e spec-driven development criado por TÂCHES. A proposta é simples: resolver o context rot mantendo seu contexto principal limpo, fazendo o trabalho pesado em subagents com contextos novos.
A diferença para outras ferramentas de spec-driven development? GSD foi feito para desenvolvedores que trabalham sozinhos, não para organizações de 50 pessoas com cerimônias de sprint e fluxos do Jira. A complexidade está no sistema, não no seu workflow.
O loop de 6 comandos
O GSD opera em um loop simples de seis comandos:
1. Initialize
/gsd-new-projectPerguntas → pesquisa → requisitos → roadmap. Você aprova, aí começa a construção.
Já tem código? Rode /gsd-map-codebase primeiro. Ele analisa seu stack, arquitetura e convenções para que o novo projeto faça as perguntas certas.
2. Discuss
/gsd-discuss-phase 1Seu roadmap tem uma frase por fase. Isso não é suficiente para construir do jeito que você imagina. O discuss captura suas decisões antes do planejamento: layouts, estrutura da API, tratamento de erros, data structures — qualquer área cinzenta dessa fase específica.
Pula essa etapa, você recebe padrões razoáveis. Usa ela, você recebe sua visão.
3. Plan
/gsd-plan-phase 1Pesquisa → planejamento → verificação, em loop até os planos passarem. Cada plano é pequeno o suficiente para executar em uma janela de contexto nova.
4. Execute
/gsd-execute-phase 1Planos executam em batches paralelos. Cada executor recebe 200k tokens de contexto novo. Cada task recebe seu próprio commit atômico. Você sai, volta, e encontra o trabalho completo com um histórico git limpo.
Sua janela de contexto principal fica em 30-40%. O trabalho acontece nos subagents.
PHASE é como você divide o trabalho dentro de uma milestone.
5. Verify
/gsd-verify-work 1Você revisa o que foi construído. Qualquer coisa quebrada recebe um plano de correção diagnosticado — pronto para nova execução imediata. Você não debuga manualmente; só roda execute de novo.
6. Repeat → Ship
/gsd-ship 1
/gsd-complete-milestone
/gsd-new-milestoneLoop discuss → plan → execute → verify → ship até a milestone terminar. Depois arquiva, cria tag, e começa a próxima do zero.
SHIP é o comando que cria o Pull Request com o trabalho verificado da fase.
Milestones são agrupamentos de fases que fazem sentido juntas. Você define quantas fases quer em cada milestone.
Por que funciona
Três coisas que a maioria dos setups de AI-coding erra:
1. Acúmulo de contexto. Quanto mais a sessão cresce, mais a qualidade degrada. GSD mantém seu contexto principal limpo fazendo o trabalho pesado em contextos novos de subagents. Pesquisadores, planejadores e executores cada um começam do zero com exatamente o que precisam.
2. Sem memória compartilhada. GSD mantém artefatos estruturados que sobrevivem entre sessões:
PROJECT.md— visãoREQUIREMENTS.md— escopoROADMAP.md— para onde você vaiSTATE.md— posição atual e decisõesCONTEXT.md— decisões de implementação por fase
Toda nova sessão carrega esses arquivos e sabe exatamente onde as coisas estão.
3. Sem verificação. Código que “roda” não é código que “funciona.” O passo de verify do GSD te guia pelo que foi construído, diagnostica falhas com agents de debug dedicados, e gera planos de correção antes de você declarar uma fase completa.
Instalação
A instalação é simples:
npx get-shit-done-cc@latestO instalador pergunta seu runtime (Claude Code, OpenCode, Gemini CLI, Kilo, Codex, Copilot, Cursor, Windsurf, e mais) e se quer instalar global ou localmente.
claude --dangerously-skip-permissions
opencode --dangerously-skip-permissions
gemini-cli --dangerously-skip-permissions
# ... dependendo do seu agenteGSD é feito para automação sem fricção. Skip-permissions é o modo recomendado para rodar.
Comandos principais
| Comando | O que faz |
|---|---|
/gsd-new-project | Perguntas → pesquisa → requisitos → roadmap |
/gsd-discuss-phase [N] | Captura decisões de implementação antes do planejamento |
/gsd-plan-phase [N] | Pesquisa + planejamento + verificação |
/gsd-execute-phase <N> | Executa planos em batches paralelos |
/gsd-verify-work [N] | Testes de aceitação manuais |
/gsd-ship [N] | Cria PR do trabalho verificado da fase |
/gsd-progress --next | Auto-detecta e roda o próximo passo |
/gsd-complete-milestone | Arquiva milestone e cria tag de release |
/gsd-new-milestone | Começa próxima versão |
Configuração
As configurações ficam em .planning/config.json. Algumas opções chave:
| Config | O que controla |
|---|---|
mode | interactive (confirma cada passo) ou yolo (auto-aprova) |
| Model profiles | quality / balanced / budget — controla qual modelo cada agente usa |
workflow.research / plan_check / verifier | Liga/desliga agents de qualidade que adicionam tokens e tempo |
parallelization.enabled | Roda planos independentes simultaneamente |
O que me conquistou
O GSD tem 61k+ estrelas no GitHub e é usado por engenheiros da Amazon, Google, Shopify e Webflow. O que me conquistou foi a simplicidade: são poucos comandos que fazem exatamente o que prometem.
Não é over-engineered. Não tenta ser uma plataforma enterprise. É um sistema que entende que devs que trabalham sozinhos precisam de algo que funcione sem burocracia.
A ideia de manter artefatos estruturados que sobrevivem entre sessões é genial. Você pode fechar o laptop, voltar amanhã, e o agente sabe exatamente onde parou. Não precisa re-explicar nada.
E o verify step é algo que eu não via em outras ferramentas. A maioria para no “execute” e assume que funcionou. GSD te obriga a verificar, e quando encontra problemas, já gera o plano de correção.
Considerações
Se você usa Claude Code (ou outro agente) regularmente e sente que a qualidade degrada em sessões longas, GSD é praticamente obrigatório. É a diferença entre “o agente às vezes funciona” e “o agente é confiável”.
A curva de aprendizado é suave — são seis comandos principais — mas o impacto na qualidade do código entregue é imenso.
Links: