Filtro Todos Ecosistema Diario Generación de Imágenes Programación Creadores de Apps Investigación Arquitectos Digitales Mentores Académicos Video Música y Voz IA Local / Privada Agentes IA

DeepSeek V4

DeepSeek · Lanzado April 24, 2026

8.3 /10 Puntuación general
Sitio web oficial

Lo que realmente es

Cada pocos meses, alguien anuncia un modelo de pesos abiertos que supuestamente iguala la frontera cerrada. DeepSeek V4 podría ser la excepción — no porque afirme superar todo (no lo hace), sino porque cambia la economía tan dramáticamente que “suficientemente cerca” se convierte en “suficientemente cerca y diez veces más barato.”

Los números que importan no son los scores de benchmarks — son los números de eficiencia. Pro usa aproximadamente 27% de los FLOPs y 10% del KV cache que V3.2 necesitaba a 1M de contexto. Dos variantes cuentan toda la estrategia de DeepSeek: Pro para la capacidad, Flash para la adopción.

Puntos fuertes

  • Salto de eficiencia masivo: Pro usa ~27% FLOPs y ~10% KV cache de V3.2 a 1M de contexto. Flash es aún más ligero. No es solo un modelo más grande — es una arquitectura fundamentalmente más eficiente.
  • 1M de contexto real: No es un número de marketing — las ganancias de eficiencia hacen que la inferencia de un millón de tokens sea realmente utilizable.
  • Dos variantes, dos casos de uso: Pro (1,6T/49B activos) para máxima capacidad en clústeres empresariales. Flash (284B/13B activos) para velocidad y costo en hardware medio.
  • Precios API bajísimos: 3-7× más baratos que equivalentes de Claude Opus. Capacidad near-frontier a precios que hacen que los modelos cerrados parezcan impuesto de lujo.
  • Flexibilidad de hardware: Optimizado para GPUs NVIDIA y Huawei Ascend. Soporte FP8/FP4 incluido.
Resumen de Benchmarks
  • Arquitectura — 1,6T MoE / 49B activos Atención híbrida con 1M de contexto. Solo 49B parámetros se activan por token en Pro (13B en Flash).
  • Eficiencia — ~73% reducción de FLOPs Vs predecesor V3.2 a 1M de contexto. El avance arquitectónico que hace viable la inferencia local de billones de parámetros.
  • Precios API — 3-7× más baratos Que equivalentes de Claude Opus. El argumento económico para pesos abiertos nunca fue más fuerte.
  • Razonamiento — competitivo con frontera DeepSeek reporta que Pro supera a GPT-5.2 y Gemini 3.0 Pro, queda 'marginalmente' detrás de GPT-5.4 y Gemini 3.1 Pro. Verificación independiente pendiente.

Limitaciones honestas

  • Versión Preview: Benchmarks independientes completos aún no disponibles. La propia evaluación de DeepSeek muestra un retraso ‘marginal’ respecto a GPT-5.4 y Gemini 3.1 Pro en algunas tareas de razonamiento.
  • Hambre de hardware (Pro): 1,6 billones de parámetros totales significa clústeres multi-GPU empresariales (4-8× H100/H200) para inferencia Pro cómoda.
  • Sin salida multimodal: Enfocado en texto. Kimi K2.6 maneja entrada multimodal (imágenes, video) nativamente — DeepSeek V4 no.
  • Ecosistema chino: Documentación en inglés y herramientas de comunidad occidental creciendo pero menos maduras.

El Veredicto: El modelo de pesos abiertos que finalmente hace que las cuentas cuadren para IA de frontera local. La combinación de capacidad a escala 1,6T, contexto de 1M, licencia MIT, 73% de reducción de cómputo y precios API que avergüenzan a los labs cerrados lo convierte en la propuesta de auto-hospedaje más convincente de 2026.