NewTechReview

Hardware + IA, Cloud, Data e Quantum em linguagem direta

NewTechReview

Hardware + IA, Cloud, Data e Quantum em linguagem direta

IA

Glossário 2026: 30 termos de IA que todo profissional precisa entender

Glossário de IA
IA · GLOSSÁRIO

30 termos de IA — 2026

O vocabulário de IA evolui mais rápido que qualquer outra área de tech. Em 2026, termos que dominaram 2024 (transformer, embedding, prompt engineering) já são considerados básicos. Aqui está a lista atualizada dos 30 conceitos que apareceram em conferências, papers e produtos comerciais.

Fundamentos

  • LLM (Large Language Model): modelo treinado em texto para gerar/prever texto.
  • Transformer: arquitetura introduzida em 2017 que viabilizou LLMs modernos.
  • Token: unidade básica de texto processada (~3 caracteres em inglês).
  • Context Window: quantidade máxima de tokens que um modelo aceita por vez.
  • Embedding: representação numérica de palavras/frases em espaço vetorial.

Geração

  • Temperature: grau de aleatoriedade na saída (0 = determinístico, 2 = caótico).
  • Top-p (nucleus sampling): filtragem das opções pelo cumulativo de probabilidade.
  • Beam Search: exploração de múltiplos caminhos de geração para escolher o melhor.
  • RAG (Retrieval-Augmented Generation): busca documentos externos antes de gerar resposta.
  • Chain of Thought (CoT): pedir ao modelo para “pensar passo a passo” antes de responder.

Otimização e Performance

  • Quantization (Q4, Q8): reduzir precisão dos pesos para economizar VRAM (Q4 = 4 bits).
  • FP4/FP8: formatos de ponto flutuante de baixa precisão otimizados para inferência.
  • LoRA (Low-Rank Adaptation): técnica para adaptar modelos grandes treinando poucos parâmetros.
  • Fine-tuning: treinar modelo pré-existente em dados específicos do seu caso.
  • Distillation: treinar modelo pequeno para imitar saídas de modelo grande.

Agentes e Tools

  • Agent: LLM que toma decisões e usa ferramentas em loop.
  • Tool Calling / Function Calling: capacidade do LLM de invocar funções/APIs externas.
  • MCP (Model Context Protocol): protocolo aberto da Anthropic para conectar LLMs a ferramentas.
  • ReAct: pattern de “raciocinar + agir + observar” em loop para resolver tarefas complexas.
  • Computer Use: agentes que controlam mouse/teclado/screenshots do computador.

Multimodal e Visão

  • VLM (Vision Language Model): modelo que processa texto + imagem (ex: GPT-4V, Claude 3.5).
  • Diffusion Model: família de modelos que gera imagens/vídeo via processo iterativo.
  • Latent Space: representação compactada onde o modelo opera (antes de “desenhar”).
  • ControlNet: modelo que adiciona controle estrutural à geração de imagem.
  • Multi-Frame Generation (MFG): técnica que gera frames intermediários sintéticos (usado por DLSS 4).

Infraestrutura

  • HBM3e: memória de alta largura de banda usada em GPUs de IA datacenter.
  • CoWoS: empacotamento avançado da TSMC que coloca GPU e HBM no mesmo substrato.
  • NVLink: interconexão proprietária NVIDIA entre GPUs (até 900 GB/s).
  • vLLM / TGI: servidores de inferência otimizados para LLMs em produção.
  • KV Cache: cache de pares chave-valor que evita recomputar atenção em cada token.

Essa é a base. Voltaremos com termos de áreas específicas (RLHF, DPO, MoE, sparsity) em posts dedicados.

NTR
Equipe Editorial NewTechReview
Análises técnicas independentes. Conheça nossa metodologia →

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *