Glossário 2026: 30 termos de IA que todo profissional precisa entender

maio 13, 2026 leandroaparecidocosta@gmail.com

Glossário de IA — IA · GLOSSÁRIO
30 termos de IA — 2026

O vocabulário de IA evolui mais rápido que qualquer outra área de tech. Em 2026, termos que dominaram 2024 (transformer, embedding, prompt engineering) já são considerados básicos. Aqui está a lista atualizada dos 30 conceitos que apareceram em conferências, papers e produtos comerciais.

Fundamentos

LLM (Large Language Model): modelo treinado em texto para gerar/prever texto.
Transformer: arquitetura introduzida em 2017 que viabilizou LLMs modernos.
Token: unidade básica de texto processada (~3 caracteres em inglês).
Context Window: quantidade máxima de tokens que um modelo aceita por vez.
Embedding: representação numérica de palavras/frases em espaço vetorial.

Geração

Temperature: grau de aleatoriedade na saída (0 = determinístico, 2 = caótico).
Top-p (nucleus sampling): filtragem das opções pelo cumulativo de probabilidade.
Beam Search: exploração de múltiplos caminhos de geração para escolher o melhor.
RAG (Retrieval-Augmented Generation): busca documentos externos antes de gerar resposta.
Chain of Thought (CoT): pedir ao modelo para “pensar passo a passo” antes de responder.

Otimização e Performance

Quantization (Q4, Q8): reduzir precisão dos pesos para economizar VRAM (Q4 = 4 bits).
FP4/FP8: formatos de ponto flutuante de baixa precisão otimizados para inferência.
LoRA (Low-Rank Adaptation): técnica para adaptar modelos grandes treinando poucos parâmetros.
Fine-tuning: treinar modelo pré-existente em dados específicos do seu caso.
Distillation: treinar modelo pequeno para imitar saídas de modelo grande.

Agentes e Tools

Agent: LLM que toma decisões e usa ferramentas em loop.
Tool Calling / Function Calling: capacidade do LLM de invocar funções/APIs externas.
MCP (Model Context Protocol): protocolo aberto da Anthropic para conectar LLMs a ferramentas.
ReAct: pattern de “raciocinar + agir + observar” em loop para resolver tarefas complexas.
Computer Use: agentes que controlam mouse/teclado/screenshots do computador.

Multimodal e Visão

VLM (Vision Language Model): modelo que processa texto + imagem (ex: GPT-4V, Claude 3.5).
Diffusion Model: família de modelos que gera imagens/vídeo via processo iterativo.
Latent Space: representação compactada onde o modelo opera (antes de “desenhar”).
ControlNet: modelo que adiciona controle estrutural à geração de imagem.
Multi-Frame Generation (MFG): técnica que gera frames intermediários sintéticos (usado por DLSS 4).

Infraestrutura

HBM3e: memória de alta largura de banda usada em GPUs de IA datacenter.
CoWoS: empacotamento avançado da TSMC que coloca GPU e HBM no mesmo substrato.
NVLink: interconexão proprietária NVIDIA entre GPUs (até 900 GB/s).
vLLM / TGI: servidores de inferência otimizados para LLMs em produção.
KV Cache: cache de pares chave-valor que evita recomputar atenção em cada token.

Essa é a base. Voltaremos com termos de áreas específicas (RLHF, DPO, MoE, sparsity) em posts dedicados.

NTR

Equipe Editorial NewTechReview

Análises técnicas independentes. Conheça nossa metodologia →

30 termos de IA — 2026

Fundamentos

Geração

Otimização e Performance

Agentes e Tools

Multimodal e Visão

Infraestrutura

Deixe um comentário Cancelar resposta