Três anos atrás, a pergunta que eu mais ouvia era: “qual é o melhor prompt?”

Dois anos atrás, mudou pra: “como faço RAG?”

Ano passado: “como construo um agent?”

Esse ano, a conversa é diferente. As pessoas estão perguntando como transformar uma organização inteira pra operar com agents. Não um chatbot no site. Dezenas de agents integrados nos processos, com governança, observabilidade, permissões granulares.

Essa evolução conta uma história. E acho que poucos pararam pra conectar os pontos.

A timeline

Prompt EngineeringContext EngineeringRAG + Tool CallingAgent EngineeringHarness EngineeringMulti-Agent SystemsFrontier Company2023202420242025202620262026+como falar com o modeloo que o modelo enxergadar memória e ação ao modeloautonomia de decisãoconfiabilidade em produçãocoordenação entre agentsempresa inteira opera com agents

Cada etapa resolveu um problema real que a anterior não cobria. Prompt engineering ensinou a falar com o modelo. Context engineering ensinou a alimentar o modelo com a informação certa. RAG e tool calling deram memória e capacidade de ação. Agents deram autonomia. E aí percebemos que autonomia sem controle é caos em produção.

O modelo virou commodity

Vou ser direto: o modelo já não é o diferencial competitivo.

Em 2023, ter acesso ao GPT-4 era vantagem real. Hoje existem GPT-5, Claude, Gemini, Llama, DeepSeek, Mistral, Qwen. Todos excelentes. Todos capazes de escrever código, interpretar imagens, chamar ferramentas, resolver problemas complexos.

Ainda existem diferenças entre eles? Sim. Mas o gap entre o melhor e o quinto melhor encolheu tanto que raramente determina o sucesso de um projeto.

Pensa assim: duas empresas usando o mesmo modelo. A primeira conecta esse modelo ao CRM, ERP, monitoramento, documentação interna, pipelines, políticas de segurança e workflows da organização. A segunda abre uma janela de chat.

Mesmo modelo. Resultados completamente diferentes.

O valor nunca esteve só no cérebro. Sempre esteve no sistema ao redor dele.

Harness engineering: o nome do jogo agora

Uma fórmula que apareceu bastante esse ano resume bem:

Agent = Model + Harness

O modelo é o “cérebro”. O harness é tudo que transforma esse cérebro num agent que funciona em produção. Uma analogia que gosto: pensa num piloto de F1. O piloto é o LLM. O carro, rádio, telemetria, equipe de box, estratégia de pneus e regulamento da corrida são o harness. Coloca o melhor piloto num carro ruim e ele perde a corrida.

Na prática, o harness de um agent corporativo inclui:

ComponenteO que fazServiço no Azure
System promptsDefine personalidade e constraintsAzure AI Foundry
Ferramentas (MCP/APIs)Dá capacidade de açãoAzure Functions, Logic Apps
RAGBusca conhecimento relevanteAzure AI Search
MemóriaMantém estado entre sessõesCosmos DB
PermissõesControla quem acessa o quêMicrosoft Entra ID
Aprovação humanaDecisões críticas passam por genteLogic Apps, Service Bus
AvaliaçãoMede qualidade das respostasAzure AI Foundry evals
ObservabilidadeLogs, traces, métricasAzure Monitor, App Insights
GuardrailsPrevine comportamentos indesejadosAzure AI Content Safety
OrquestraçãoCoordena múltiplos agentsAzure Container Apps, AKS

Percebe o padrão? Quase nada dessa lista é IA. É engenharia de software. Infraestrutura. O tipo de coisa que a gente já faz há anos, aplicado a um contexto novo.

Um exemplo concreto

Imagina um agent que responde perguntas sobre sua infraestrutura Azure. Alguém pergunta:

“Qual VM está consumindo mais CPU nas últimas 24h?”

O modelo sozinho não sabe a resposta. Ele não tem acesso ao seu ambiente.

Com um harness bem montado, o fluxo real é:

  1. O agent identifica a intenção (query de métricas de VM)
  2. Valida se o usuário tem permissão pra acessar esses dados (Entra ID)
  3. Consulta o Azure Resource Graph pra listar as VMs
  4. Chama o Azure Monitor pra puxar métricas de CPU
  5. Compara os resultados e identifica o pior caso
  6. Monta a resposta com dados reais
  7. Opcionalmente, sugere ação (resize, alerta, runbook)

Esse fluxo inteiro não tem nada a ver com “qual modelo usar”. É design de sistema. É integrações. É permissões. É observabilidade.

Em código, a chamada do agent pro Azure Resource Graph seria algo como:

az graph query -q "
  Resources
  | where type == 'microsoft.compute/virtualmachines'
  | project name, resourceGroup, location, properties.hardwareProfile.vmSize
" --output table

E as métricas de CPU viriam do Monitor:

az monitor metrics list \
  --resource "/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.Compute/virtualMachines/{vm}" \
  --metric "Percentage CPU" \
  --interval PT1H \
  --start-time 2026-07-02T00:00:00Z \
  --end-time 2026-07-03T00:00:00Z \
  --output table

O modelo só entra pra decidir a sequência de chamadas e formatar a resposta final. O harness faz o trabalho pesado.

Context engineering: o sistema operacional do agent

Contexto não é só “jogar documentos no prompt”.

Context engineering é decidir:

  • O que o agent pode enxergar (e o que não pode)
  • Quando pode enxergar (contexto temporal)
  • Por quanto tempo retém informação (memória de curto vs longo prazo)
  • Em qual formato recebe os dados (structured vs unstructured)
  • Quanto espaço cada peça ocupa no token budget

Escrevi sobre isso em detalhe no post sobre context engineering. A versão curta: contexto bem montado é 80% do resultado. Modelo mediano com contexto excelente supera modelo top com contexto ruim.

MCP: o USB-C dos agents

Outro componente do harness que explodiu em 2026: o Model Context Protocol. Já escrevi sobre isso aqui e aqui, mas no contexto desse post o ponto é simples.

Antes do MCP, cada ferramenta precisava de uma integração custom. Agora existe um protocolo padronizado que conecta qualquer modelo a qualquer sistema. É o que permitiu harness engineering escalar. Em vez de construir integrações one-off, você expõe seus sistemas como MCP servers e qualquer agent pode consumir.

Frontier company: quando o harness vira a empresa

A Microsoft começou a usar o termo “frontier company” pra descrever algo que vai além de “empresa que usa IA”.

Uma frontier company não é uma empresa onde alguns funcionários usam Copilot. É uma empresa onde:

  • Agents fazem parte dos processos de negócio
  • Humanos supervisionam e decidem, agents pesquisam e executam
  • Existe governança real sobre o que agents podem fazer
  • Produtividade é medida no nível organizacional
  • Dados e sistemas estão conectados de forma que agents conseguem navegar

A diferença parece sutil. Mas muda a arquitetura do negócio inteiro.

O paralelo com o que já vivemos

Nos anos 2000, aprendemos a construir pra servidores físicos. Depois virtualização. Depois cloud. Depois containers. Depois Kubernetes.

Cada uma dessas mudanças parecia ser “só uma nova tecnologia”. Na real, cada uma mudou completamente como pensamos software. Cloud não foi “rodar VM em outro lugar”. Foi um modelo mental novo sobre como construir, operar e escalar sistemas.

Tenho a impressão de que estamos vivendo a mesma coisa de novo. Aplicações cujo comportamento é definido por agents já existem em produção. E elas pedem práticas diferentes, arquiteturas diferentes, formas diferentes de testar e monitorar.

Se a era anterior foi “cloud native”, talvez essa seja “agent native”.

O diferencial real

Daqui a alguns anos, duvido que alguém pergunte qual modelo sua empresa usa. Da mesma forma que hoje ninguém pergunta qual hipervisor roda seu ambiente ou qual web server entrega seu site.

O diferencial vai estar em outro lugar:

  • Na qualidade do contexto que seus agents recebem
  • Na engenharia do harness (segurança, observabilidade, governança)
  • Na integração entre agents e pessoas
  • Na capacidade de transformar inteligência artificial em inteligência organizacional

Porque empresas não competem por modelos. Competem pela capacidade de usar conhecimento pra tomar decisões melhores, mais rápido.

E o sistema que permite isso tem nome: harness.


Este post também está disponível em inglês. Se você quer se aprofundar nos conceitos técnicos mencionados aqui, recomendo os posts da série AI Engineering pra quem é de infra, especialmente os sobre context engineering, RAG e MCP.