DeepSeek V4
DeepSeek · Lanzado April 24, 2026
Lo que realmente es
Cada pocos meses, alguien anuncia un modelo de pesos abiertos que supuestamente iguala la frontera cerrada. DeepSeek V4 podría ser la excepción — no porque afirme superar todo (no lo hace), sino porque cambia la economía tan dramáticamente que “suficientemente cerca” se convierte en “suficientemente cerca y diez veces más barato.”
Los números que importan no son los scores de benchmarks — son los números de eficiencia. Pro usa aproximadamente 27% de los FLOPs y 10% del KV cache que V3.2 necesitaba a 1M de contexto. Dos variantes cuentan toda la estrategia de DeepSeek: Pro para la capacidad, Flash para la adopción.
Puntos fuertes
- Salto de eficiencia masivo: Pro usa ~27% FLOPs y ~10% KV cache de V3.2 a 1M de contexto. Flash es aún más ligero. No es solo un modelo más grande — es una arquitectura fundamentalmente más eficiente.
- 1M de contexto real: No es un número de marketing — las ganancias de eficiencia hacen que la inferencia de un millón de tokens sea realmente utilizable.
- Dos variantes, dos casos de uso: Pro (1,6T/49B activos) para máxima capacidad en clústeres empresariales. Flash (284B/13B activos) para velocidad y costo en hardware medio.
- Precios API bajísimos: 3-7× más baratos que equivalentes de Claude Opus. Capacidad near-frontier a precios que hacen que los modelos cerrados parezcan impuesto de lujo.
- Flexibilidad de hardware: Optimizado para GPUs NVIDIA y Huawei Ascend. Soporte FP8/FP4 incluido.
-
Arquitectura — 1,6T MoE / 49B activos Atención híbrida con 1M de contexto. Solo 49B parámetros se activan por token en Pro (13B en Flash).
-
Eficiencia — ~73% reducción de FLOPs Vs predecesor V3.2 a 1M de contexto. El avance arquitectónico que hace viable la inferencia local de billones de parámetros.
-
Precios API — 3-7× más baratos Que equivalentes de Claude Opus. El argumento económico para pesos abiertos nunca fue más fuerte.
-
Razonamiento — competitivo con frontera DeepSeek reporta que Pro supera a GPT-5.2 y Gemini 3.0 Pro, queda 'marginalmente' detrás de GPT-5.4 y Gemini 3.1 Pro. Verificación independiente pendiente.
Limitaciones honestas
- Versión Preview: Benchmarks independientes completos aún no disponibles. La propia evaluación de DeepSeek muestra un retraso ‘marginal’ respecto a GPT-5.4 y Gemini 3.1 Pro en algunas tareas de razonamiento.
- Hambre de hardware (Pro): 1,6 billones de parámetros totales significa clústeres multi-GPU empresariales (4-8× H100/H200) para inferencia Pro cómoda.
- Sin salida multimodal: Enfocado en texto. Kimi K2.6 maneja entrada multimodal (imágenes, video) nativamente — DeepSeek V4 no.
- Ecosistema chino: Documentación en inglés y herramientas de comunidad occidental creciendo pero menos maduras.
El Veredicto: El modelo de pesos abiertos que finalmente hace que las cuentas cuadren para IA de frontera local. La combinación de capacidad a escala 1,6T, contexto de 1M, licencia MIT, 73% de reducción de cómputo y precios API que avergüenzan a los labs cerrados lo convierte en la propuesta de auto-hospedaje más convincente de 2026.