¿Qué tan inteligente es el chatbot «Frighteningly Smart» de Elon Musk?

xAI ha introducido un nuevo modelo de lenguaje, Grok 3, que el fundador de la compañía, Elon Musk, llamó "la IA más inteligente de la Tierra." Los creadores del chatbot afirman que la nueva versión supera significativamente a la anterior: procesa un mayor volumen de datos de entrenamiento y cuenta con nuevos mecanismos de autocorrección. La versión de demostración de Grok 3 se lanzó hoy, y ya han aparecido las primeras reseñas.
¿Qué hay de nuevo?
La principal ventaja de Grok 3 es el acceso a recursos computacionales mejorados. El chatbot se entrena utilizando el superordenador Colossus: en las etapas iniciales, sus creadores emplearon 100,000 NVIDIA H100 GPUs, y luego duplicaron esa cantidad. En el futuro, se espera que la potencia de cálculo aumente cinco veces.
Grok 3 incluye mecanismos de autocorrección integrados. La IA analiza sus propias respuestas, las compara con respuestas de referencia y luego hace ajustes. Curiosamente, el chatbot recibe "recompensas" por respuestas precisas y "penalizaciones" por las llamadas "alucinaciones" — información incorrecta o fabricada.
Según los representantes de xAI, Grok 3 es más inteligente que otros modelos en matemáticas, ciencias naturales y programación. Se utilizaron pruebas ciegas para evaluar la calidad de las respuestas, lo que significa que los usuarios no sabían qué chatbot estaba respondiendo.
Durante la presentación de Grok 3, xAI también mostró Deep Search — un agente de búsqueda de "nueva generación" capaz de encontrar y analizar información en línea rápidamente. Aunque existen características similares en modelos competidores, xAI afirma que Deep Search es más preciso.
Además, Grok 3 pronto recibirá una interfaz de voz, lo que permitirá a los usuarios interactuar con él como si estuvieran hablando con una persona real. Se dice que su voz suena más natural y expresiva que la de los modelos competidores.
Do you use artificial intelligence for work or study?
¿Cómo se desempeña en la práctica?
Los usuarios en la red social X pueden acceder al nuevo chatbot al suscribirse a X Premium+ por $50 al mes. Aunque aún no hay muchas reseñas tempranas de Grok 3, algunas destacan.
Por ejemplo, un usuario llamado Penny2x compartió que creó un juego completamente funcional utilizando la nueva versión de IA:
Grok 3 acaba de ser lanzado. No lo vas a creer, ya he creado un juego.
(Tuve acceso anticipado ESTA MAÑANA).
Este juego fue creado 100% por GROK, solo le dije lo que quería y puse el código en el lugar correcto.
Solo sigo pidiendo ajustes, y sigue generando el juego en un solo archivo que puedo poner en mi escritorio y ejecutar.
El juego ha cambiado para siempre. He estado desarrollando mucho con IA de otros grandes creadores de IA últimamente, tratando de decidir cuál me gusta más, y grok es un JUGADOR. No tengo benchmarks oficiales, y aún no tengo configurada la API, así que no es mi flujo de trabajo normal, pero se sintió tan capaz como Sonet, 4o, o cualquier otra cosa.
En el próximo día o dos lo configuraré como parte de mi flujo de trabajo en NVIM y lo pondré a trabajar de verdad.
Esto es increíble. Vivimos en el futuro. Todos son desarrolladores ahora.
Aún más interesante es lo que piensa Andrej Karpathy, cofundador de OpenAI, sobre Grok 3. También probó el nuevo modelo de lenguaje. Según Karpathy, en algunas áreas, el chatbot rivaliza con los principales competidores:
...Grok 3 claramente tiene un modelo de pensamiento de última generación (botón "Think") y funcionó muy bien desde el principio en mi pregunta sobre Settlers of Catan:
"Crea una página web de un juego de mesa que muestre una cuadrícula hexagonal, justo como en el juego Settlers of Catan. Cada cuadrícula hexagonal está numerada del 1..N, donde N es el número total de losetas hexagonales. Hazlo genérico, para que se pueda cambiar el número de "anillos" usando un control deslizante. Por ejemplo, en Catan, el radio es de 3 hexágonos. Una sola página HTML, por favor."
Pocos modelos logran esto de manera confiable. Los principales modelos de pensamiento de OpenAI (por ejemplo, o1-pro, a $200/mes) también lo logran, pero todos los de DeepSeek-R1, Gemini 2.0 Flash Thinking y Claude no.
Andrej Karpathy también apreció la determinación de Grok 3:
Me gusta que el modelo intentará resolver la hipótesis de Riemann cuando se le pida, similar a DeepSeek-R1, pero a diferencia de muchos otros modelos que se rinden instantáneamente (o1-pro, Claude, Gemini 2.0 Flash Thinking) y simplemente dicen que es un gran problema no resuelto. Tuve que detenerlo eventualmente porque me sentí un poco mal por él, pero mostró valentía, y quién sabe, tal vez algún día...
Sin embargo, hubo algunos inconvenientes. El agente de búsqueda profunda planteó algunas preocupaciones:
…el modelo no parece gustarle referenciar X como fuente por defecto, aunque puedes pedírselo explícitamente. Un par de veces lo sorprendí alucinando URLs que no existen. Un par de veces dijo cosas fácticas que creo que son incorrectas y no proporcionó una cita para ello (probablemente no existe).
En conclusión, Andrej Karpathy señaló que, basándose en impresiones iniciales, Grok 3 ha alcanzado el nivel de los principales modelos de OpenAI, como o1-pro ($200 al mes), e incluso supera ligeramente a DeepSeek-R1 y Gemini 2.0 Flash Thinking. Considerando que el equipo de xAI comenzó a desarrollar esta IA desde cero hace aproximadamente un año, el progreso es impresionante. Sin embargo, se necesitan pruebas más completas antes de determinar si el chatbot realmente merece el título de "el más inteligente."
Preocupaciones de sesgo
No es un secreto que Elon Musk participa activamente en la vida política de EE. UU. y expresa abiertamente sus opiniones. Algunos usuarios de internet se preocupan de que Grok 3 también pueda impulsar ciertas narrativas.
Estas preocupaciones no son infundadas: Musk compartió una captura de pantalla que muestra al chatbot criticando a un medio de comunicación mientras elogia a X como la fuente de información más confiable. Esto a pesar de que Grok 3 está posicionado como un producto con una censura mínima. Muchas personas creen que la IA debería permanecer neutral en sus juicios.
***
Sin embargo, el lanzamiento de otro modelo de lenguaje prometedor marca un hito importante en la carrera de IA en curso. Cuanto mayor es la competencia, más rápido avanza el progreso.
¿Qué opinas sobre Grok 3? Comparte tus pensamientos en los comentarios.
How do you feel about the rapid development of AI?
-
Top 10 Redes Neuronales para Todas las Ocasiones
-
Cómo usar la red neuronal Suno AI
-
Las mejores redes neuronales para la generación de contenido en enero-febrero de 2025
-
La búsqueda de ChatGPT se vuelve más accesible — OpenAI desafía a los gigantes de la búsqueda
-
Elon Musk critica nuevamente los juegos 'woke', promete abrir su propio estudio