Glossário 2026: 30 termos de IA que todo profissional precisa entender
O vocabulário de IA evolui mais rápido que qualquer outra área de tech. Em 2026, termos que dominaram 2024 (transformer, embedding, prompt engineering) já são considerados básicos. Aqui está a lista atualizada dos 30 conceitos que apareceram em conferências, papers e produtos comerciais.
Fundamentos
- LLM (Large Language Model): modelo treinado em texto para gerar/prever texto.
- Transformer: arquitetura introduzida em 2017 que viabilizou LLMs modernos.
- Token: unidade básica de texto processada (~3 caracteres em inglês).
- Context Window: quantidade máxima de tokens que um modelo aceita por vez.
- Embedding: representação numérica de palavras/frases em espaço vetorial.
Geração
- Temperature: grau de aleatoriedade na saída (0 = determinístico, 2 = caótico).
- Top-p (nucleus sampling): filtragem das opções pelo cumulativo de probabilidade.
- Beam Search: exploração de múltiplos caminhos de geração para escolher o melhor.
- RAG (Retrieval-Augmented Generation): busca documentos externos antes de gerar resposta.
- Chain of Thought (CoT): pedir ao modelo para “pensar passo a passo” antes de responder.
Otimização e Performance
- Quantization (Q4, Q8): reduzir precisão dos pesos para economizar VRAM (Q4 = 4 bits).
- FP4/FP8: formatos de ponto flutuante de baixa precisão otimizados para inferência.
- LoRA (Low-Rank Adaptation): técnica para adaptar modelos grandes treinando poucos parâmetros.
- Fine-tuning: treinar modelo pré-existente em dados específicos do seu caso.
- Distillation: treinar modelo pequeno para imitar saídas de modelo grande.
Agentes e Tools
- Agent: LLM que toma decisões e usa ferramentas em loop.
- Tool Calling / Function Calling: capacidade do LLM de invocar funções/APIs externas.
- MCP (Model Context Protocol): protocolo aberto da Anthropic para conectar LLMs a ferramentas.
- ReAct: pattern de “raciocinar + agir + observar” em loop para resolver tarefas complexas.
- Computer Use: agentes que controlam mouse/teclado/screenshots do computador.
Multimodal e Visão
- VLM (Vision Language Model): modelo que processa texto + imagem (ex: GPT-4V, Claude 3.5).
- Diffusion Model: família de modelos que gera imagens/vídeo via processo iterativo.
- Latent Space: representação compactada onde o modelo opera (antes de “desenhar”).
- ControlNet: modelo que adiciona controle estrutural à geração de imagem.
- Multi-Frame Generation (MFG): técnica que gera frames intermediários sintéticos (usado por DLSS 4).
Infraestrutura
- HBM3e: memória de alta largura de banda usada em GPUs de IA datacenter.
- CoWoS: empacotamento avançado da TSMC que coloca GPU e HBM no mesmo substrato.
- NVLink: interconexão proprietária NVIDIA entre GPUs (até 900 GB/s).
- vLLM / TGI: servidores de inferência otimizados para LLMs em produção.
- KV Cache: cache de pares chave-valor que evita recomputar atenção em cada token.
Essa é a base. Voltaremos com termos de áreas específicas (RLHF, DPO, MoE, sparsity) em posts dedicados.
NTR
Equipe Editorial NewTechReview
Análises técnicas independentes. Conheça nossa metodologia →
