Como vector databases funcionam por dentro
O time de ML acabou de te pedir um “vector database” em produção. Você sabe operar PostgreSQL, Redis, Cosmos DB. Mas isso? É um banco de dados ou um índice de busca? Precisa de backup? Tem replicação? Qual o modelo de consistência? Vamos abrir o capô. O mapa pro profissional de infra Conceito Vector DB O que faz Equivalente em infra Vector/Embedding Array de floats que representa significado Uma row com 1536 colunas numéricas Similarity search Buscar vetores parecidos Query com ORDER BY distance LIMIT K Index (HNSW, IVF) Estrutura pra busca rápida B-tree, hash index num banco relacional Dimension Tamanho do vetor (768, 1536, 3072) Largura da row (quantas colunas) Distance metric Como calcular “parecido” Cosine similarity, Euclidean, dot product Recall % de resultados corretos encontrados Taxa de acerto da recuperação (o que deveria aparecer apareceu?) O problema fundamental Num banco relacional, buscar é comparar valores exatos ou ranges. WHERE status = 'active' ou WHERE created_at > '2024-01-01'. Indexes como B-tree resolvem isso em O(log n). ...