DeepSeek V4

DeepSeek · Lanzado April 24, 2026

8.3 /10 Puntuación general

Lo que realmente es

Cada pocos meses, alguien anuncia un modelo de pesos abiertos que supuestamente iguala la frontera cerrada. DeepSeek V4 podría ser la excepción — no porque afirme superar todo (no lo hace), sino porque cambia la economía tan dramáticamente que “suficientemente cerca” se convierte en “suficientemente cerca y diez veces más barato.”

Los números que importan no son los scores de benchmarks — son los números de eficiencia. Pro usa aproximadamente 27% de los FLOPs y 10% del KV cache que V3.2 necesitaba a 1M de contexto. Dos variantes cuentan toda la estrategia de DeepSeek: Pro para la capacidad, Flash para la adopción.

Puntos fuertes

Salto de eficiencia masivo: Pro usa ~27% FLOPs y ~10% KV cache de V3.2 a 1M de contexto. Flash es aún más ligero. No es solo un modelo más grande — es una arquitectura fundamentalmente más eficiente.
1M de contexto real: No es un número de marketing — las ganancias de eficiencia hacen que la inferencia de un millón de tokens sea realmente utilizable.
Dos variantes, dos casos de uso: Pro (1,6T/49B activos) para máxima capacidad en clústeres empresariales. Flash (284B/13B activos) para velocidad y costo en hardware medio.
Precios API bajísimos: 3-7× más baratos que equivalentes de Claude Opus. Capacidad near-frontier a precios que hacen que los modelos cerrados parezcan impuesto de lujo.
Flexibilidad de hardware: Optimizado para GPUs NVIDIA y Huawei Ascend. Soporte FP8/FP4 incluido.

Resumen de Benchmarks

Arquitectura — 1,6T MoE / 49B activos Atención híbrida con 1M de contexto. Solo 49B parámetros se activan por token en Pro (13B en Flash).
Eficiencia — ~73% reducción de FLOPs Vs predecesor V3.2 a 1M de contexto. El avance arquitectónico que hace viable la inferencia local de billones de parámetros.
Precios API — 3-7× más baratos Que equivalentes de Claude Opus. El argumento económico para pesos abiertos nunca fue más fuerte.
Razonamiento — competitivo con frontera DeepSeek reporta que Pro supera a GPT-5.2 y Gemini 3.0 Pro, queda 'marginalmente' detrás de GPT-5.4 y Gemini 3.1 Pro. Verificación independiente pendiente.

Limitaciones honestas

Versión Preview: Benchmarks independientes completos aún no disponibles. La propia evaluación de DeepSeek muestra un retraso ‘marginal’ respecto a GPT-5.4 y Gemini 3.1 Pro en algunas tareas de razonamiento.
Hambre de hardware (Pro): 1,6 billones de parámetros totales significa clústeres multi-GPU empresariales (4-8× H100/H200) para inferencia Pro cómoda.
Sin salida multimodal: Enfocado en texto. Kimi K2.6 maneja entrada multimodal (imágenes, video) nativamente — DeepSeek V4 no.
Ecosistema chino: Documentación en inglés y herramientas de comunidad occidental creciendo pero menos maduras.

El Veredicto: El modelo de pesos abiertos que finalmente hace que las cuentas cuadren para IA de frontera local. La combinación de capacidad a escala 1,6T, contexto de 1M, licencia MIT, 73% de reducción de cómputo y precios API que avergüenzan a los labs cerrados lo convierte en la propuesta de auto-hospedaje más convincente de 2026.