Quando o assunto são harnesses de coding agent, sempre surge a mesma pergunta: “mas por que você não usa Pi?” ou “por que não Oh-My-Pi?”. É uma questão que, para muitos, causa mais estranhamento do que esclarecimento.
O problema, segundo a análise, não é a ferramenta em si, mas a falta de justificativa. Quase ninguém explica o porquê. Qual o benefício objetivo? Que problema essas ferramentas resolvem melhor que o Claude Code ou o OpenCode? Em que casos de uso são superiores? Que limitações concretas removem?
Normalmente, a resposta é vazia, vindo apenas o nome da ferramenta. Isso, para quem já testou e analisou profundamente o tema, cheira a duas coisas: ou fãs buscando validação para suas escolhas, ou pessoas tentando terceirizar a pesquisa. A ideia de “testa aí e me diz se minha ferramenta favorita é boa” não é exatamente um grande incentivo.
Mesmo assim, o teste foi feito. E, como esperado, não houve grandes surpresas. Antes de mergulhar em Pi, OpenCode e Oh-My-Pi, é crucial alinhar o vocabulário, um ponto já abordado em publicações anteriores, como em “RANT: IA acabou com os programadores?”, mas que vale a pena repetir, pois a confusão entre os termos é comum.
O que é um harness de coding agent?
Uma LLM (Large Language Model) pura não edita seu projeto. Ela apenas recebe texto e devolve texto. Nada mais.
Ao usar ferramentas como Claude Code, Codex, OpenCode, Oh-My-Pi, Crush ou similares, o usuário não está interagindo diretamente com o “modelo” em sua forma crua. Há um programa intermediário que configura o ambiente de trabalho da LLM.
Esse programa é o que se chama de harness. A metáfora é clara: um cavalo bruto tem muita força, mas sem arreio corre para qualquer lado. O harness serve para prender e direcionar o modelo, controlando seu comportamento.
As funções de um harness são diversas:
Ele monta o system prompt, que são as regras de comportamento da LLM.
Lê arquivos de contexto importantes, como
AGENTS.md,CLAUDE.md, regras locais, skills e toda a documentação do projeto.Define quais tools a LLM pode acionar.
Executa essas ferramentas: leitura de arquivos, pesquisa de texto, edição, execução de comandos de shell, rodar testes, abrir o navegador, consultar o LSP (Language Server Protocol), chamar o MCP.
Coleta os resultados das ferramentas e os retorna ao modelo como um novo contexto.
Gerencia permissões, ambientes sandbox e a confirmação de comandos potencialmente perigosos.
Controla o plano de execução, listas de tarefas e a atuação de subagentes em paralelo.
Detecta quando o contexto está se enchendo e dispara a compactação.
Tenta preservar a memória entre turnos ou sessões de trabalho.
Decide como interromper, retomar ou redirecionar o agente caso o usuário mude de ideia no meio de uma tarefa.
É por todas essas razões que dois CLIs (Command Line Interfaces), mesmo utilizando o mesmo modelo de LLM, podem apresentar comportamentos distintos. A diferença não se resume a escolher entre “GPT 5.5 vs Opus 4.7”. A equação é “modelo mais harness”. É o harness que determina qual informação o modelo acessa, quais ferramentas ele conhece, qual formato de patch ele usa, como confirma ações, quando sumariza, quando aciona um subagente e quando para.
Essa camada é o que diferencia um simples chat com cópia e cola manual de uma ferramenta capaz de interagir e modificar um projeto real de desenvolvimento.
O problema dos planos subsidiados
Para quem utiliza agentes de programação por muitas horas diariamente, os planos subsidiados oferecidos por empresas como a Anthropic e a OpenAI são consideravelmente mais vantajosos do que pagar por token avulso.
O pagamento direto via API é caro. Muito caro. Se o desenvolvedor pratica um Agile Vibe Coding de verdade, deixando o agente rodar testes, ler código, refatorar, compilar, reescrever e revisar, o consumo de tokens dispara, como um churrasco de fim de semana.
Um plano mensal, por outro lado, muda completamente a dinâmica financeira. O usuário paga um valor fixo, obtém uma cota substancial e consegue trabalhar sem a preocupação constante de calcular cada chamada de ferramenta como se fosse um taxímetro.
O desafio reside no fato de que a Anthropic possui políticas restritas sobre onde esses planos podem ser utilizados. A própria documentação de Legal and compliance do Claude Code especifica que o OAuth dos planos Free, Pro e Max é destinado ao Claude Code e a aplicações nativas da Anthropic. Desenvolvedores terceiros, por sua vez, devem usar uma API key via Claude Console ou diretamente na nuvem.