DeepSeek lanza una versión mejorada de la IA V3 tres meses después del primer lanzamiento

La empresa china DeepSeek ha lanzado una versión actualizada de su inteligencia artificial lingüística a gran escala, DeepSeek-V3-0324, apenas tres meses después del lanzamiento de la primera versión V3 en diciembre de 2024.
Esto es lo que sabemos
El nuevo modelo ha mejorado el rendimiento y las capacidades, incluida la creación de páginas web estéticamente agradables e informes de alta calidad en chino.
DeepSeek-V3-0324 ha llamado la atención por sus reducidos requisitos de hardware para el entrenamiento, un tiempo de entrenamiento más rápido y menores costes de API con un alto rendimiento en comparación con competidores como GPT de OpenAI.

Rendimiento de DeepSeek. Ilustración: DeepSeek
El modelo actualizado no implica pensar, lo que le permite proporcionar respuestas rápidamente, sin detenerse en tareas complejas, a diferencia del modelo DeepSeek R1. La nueva versión tiene un tamaño de parámetros de 685.000 millones, lo que la convierte en uno de los mayores modelos lingüísticos disponibles públicamente.
DeepSeek-V3-0324 obtuvo entre un 5,3% y un 19,8% más en las pruebas de inteligencia artificial que la versión anterior. En términos de rendimiento, se acerca a líderes como GPT-4.5 y Claude Sonnet 3.7.
Además, la versión actualizada ha demostrado mejoras en la creación de páginas web, así como en la búsqueda, escritura y traducción de textos en chino.
Para probar la versión completa del modelo, los usuarios necesitarán al menos 700 GB de espacio libre en disco y varias GPU Nvidia A100/H100. Sin embargo, también existen versiones simplificadas del modelo que pueden ejecutarse con una sola GPU, como la Nvidia 3090.
Fuente: DeepSeek