DeepSeek ha lanzado Janus-Pro-7B, superando a DALL-E 3 y Stable Diffusion en capacidades de generación de imágenes

La empresa china DeepSeek ha presentado su nueva red neuronal multimodal, Janus-Pro-7B, diseñada para un reconocimiento y generación de imágenes eficientes. En comparación con versiones anteriores, el nuevo modelo ha sido significativamente mejorado: se han optimizado los algoritmos de entrenamiento, se ha ampliado el conjunto de datos y se ha incrementado el tamaño del modelo. Estos cambios han permitido a la red neuronal mejorar enormemente su rendimiento en tareas relacionadas con la generación de imágenes a partir de descripciones textuales y el análisis de imágenes.

Janus-Pro-7B ha superado a modelos bien conocidos como DALL-E 3 y Stable Diffusion en las pruebas GenEval y DPG-Bench. Esta red neuronal ofrece altos niveles de detalle y realismo en la creación de imágenes, lo que la convierte en un fuerte competidor frente a otras soluciones. El modelo ya está disponible en la plataforma Hugging Face, y el código se puede descargar de forma gratuita desde GitHub, lo que permite a investigadores y desarrolladores contribuir a su desarrollo.

La publicación fue traducida Mostrar original (EN)
0
Comentarios 0