NVIDIA Blackwell B300: o motor por trás da próxima onda de IA (e como afeta o seu PC)
A NVIDIA está vendendo densidade de inteligência por watt. O B300, herdeiro do B200, traz 50% mais HBM3e (até 288 GB) e ganhos consistentes em treino e inferência de modelos com mais de 1 trilhão de parâmetros.
Por que importa pra quem não trabalha em datacenter
O que acontece num rack DGX hoje vai sair como produto na sua casa em 18 meses. CoWoS, HBM3e, NVLink fabric “pingam” para placas de consumidor — é por isso que as RTX 50 herdaram tanta arquitetura do Hopper.
O que muda na prática
- Treino: GPT-5 e Claude 5 ficam 2x mais baratos por hora-GPU
- Inferência: custo por 1M tokens cai 40%
- Cloud: AWS, GCP e Azure já confirmaram instâncias B300
- RTX 5090 com 32GB roda Llama 70B em ~38 tokens/s
Workstation IA 2026: shopping list
- B300 reduz custo por token em 40%
- Trickle-down beneficia consumidor
- RTX 5090 finalmente roda Llama 70B
- Cloud spot mais barato
- B300 é só datacenter (US$ 30-40k)
- RTX 5090 escassa no Brasil
- Consumo de energia continua subindo
Como nós testamos
Não temos B300 (US$ 30k+ por unidade — datacenter only). Análise baseada em benchmarks publicados pela NVIDIA, MLPerf 4.1, e relatórios de AWS, Azure e GCP em workloads de inferência LLM 70B+ e treino fine-tuning.
Cenários de uso real — para quem vale
- Engenheiro ML em corporação — entender o que muda no cloud
- Founder de startup IA — planejar custos de inferência 2026-2027
- Acadêmico/PhD — entender shift de hardware vs software
- Investidor em IA — saber quem ganha (NVIDIA + ASML + TSMC)
FAQ — Dúvidas frequentes
B300 vai pingar para RTX 60?
Sim, em 18-24 meses. RTX 60 (2027) deve ter FP4 nativo + HBM3e em consumer.
AMD MI400 compete?
Em raster sim, em ecossistema CUDA não. NVIDIA continua no topo enterprise.
Quanto custa hora de B300 na AWS?
~US$ 8/hora spot. Vs A100 (~US$ 3) e H100 (~US$ 6).
Vale comprar RTX 5090 hoje?
Para inferência local de modelos <70B, sim. Para treino sério, alugue cloud.
Veredito: o B300 não é só “uma GPU mais rápida”. É o que vai segurar o ritmo de Moore para IA por mais um ciclo.
