Infrastructure as Code para AI: automatizando GPU clusters
Quinto post da série. No anterior, mergulhamos dentro da GPU. Agora vamos automatizar tudo ao redor dela. Porque entender GPUs é metade da batalha; provisionar elas de forma consistente e em escala é onde engenharia de infraestrutura realmente encontra AI. O typo de $4.000 Comecei a semana com uma vitória. Provisionei um cluster GPU manualmente em East US 2 pra um experimento de ML: AKS com node pool Standard_NC6s_v3, accelerated networking, drivers NVIDIA, taints corretos. Levou quase um dia, mas funcionou. ...