Cargando...
Cargando...

DeepSeek es un modelo de lenguaje avanzado diseñado para ofrecer capacidades de búsqueda y análisis de datos con inteligencia artificial, facilitando la extracción de información relevante de grandes volúmenes de texto.
Visitar sitio oficialDeepSeek es un modelo de lenguaje avanzado diseñado para ofrecer capacidades de búsqueda y análisis de datos con inteligencia artificial, facilitando la extracción de información relevante de grandes volúmenes de texto.
Modelo de lenguaje de última generación con capacidad de contexto de 1 millón de tokens, optimizado para tareas complejas y agentes inteligentes.
Modelo experimental centrado en capacidades de razonamiento avanzadas, diseñado para tareas complejas y agentes inteligentes.
Modelo equilibrado que ofrece un rendimiento sólido en tareas generales y de razonamiento, adecuado para una amplia gama de aplicaciones.
Versión experimental que introduce DeepSeek Sparse Attention para mejorar la eficiencia en contextos largos, manteniendo un rendimiento competitivo.
Actualización de V3.1 con mejor rendimiento (sep 2025). Versión optimizada antes de la transición a V3.2.
Modelo híbrido con modos thinking y non-thinking (ago 2025). 671B MoE. Supera a V3 y R1 en +40% en SWE-bench y Terminal-bench. Open source MIT.
Actualización del modelo de razonamiento R1 (may 2025). Mejor seguimiento de instrucciones y formato. Open source MIT. Publicado en Nature sep 2025.
Actualización que mejora significativamente el rendimiento en razonamiento, desarrollo frontend y capacidades de uso de herramientas.
Modelo de código abierto con rendimiento comparable a OpenAI-o1, adecuado para tareas generales y de razonamiento.
Modelo de propósito general de DeepSeek (dic 2024). 671B parámetros con MoE. Estado del arte en benchmarks de código y conocimiento general al lanzamiento.
Combinación de DeepSeek-V2-0628 y DeepSeek-Coder-V2-0724, ofreciendo capacidades generales y de codificación.
Versión mejorada de DeepSeek-V2-Chat con base en Coder-V2-base, optimizada para generación de código y razonamiento.
Versión mejorada de DeepSeek-V2-Chat con base en Coder-V2-base, optimizada para generación de código y razonamiento.
MoE de 236B de parámetros. Fue pionero usando Multi-head Latent Attention (MLA), optimizando dramáticamente la memoria Caché y acelerando la respuesta a fracciones de segundo.
Versión más ligera y rápida del modelo V4-Pro, con contexto de 1 millón de tokens, ideal para aplicaciones que requieren eficiencia y velocidad.
Versión mejorada de DeepSeek-Coder con optimización de alineación, enfocada en capacidades generales.
Las vertientes puramente Multimodales de DeepSeek con capacidades robustas para análisis de imágenes de alta resolución a un muy bajo nivel computacional y gasto.
Especialista en código de DeepSeek (jun 2024). Supera a GPT-4 Turbo en benchmarks de programación. 236B parámetros con arquitectura MoE.
Modelo código centrico que llegó a posicionarse a la altura de GPT-4-Turbo en benchmarks de matemáticas y programación abarcando 338 lenguajes de código en 2024.