La organización de investigación estadounidense OpenAI ha introducido una nueva función para ChatGPT llamada Operator. Este agente de IA puede realizar acciones de forma autónoma en Internet en nombre de los usuarios.
Operator está impulsado por un nuevo modelo llamado Agente que Usa Computadoras (CUA). Combinando las capacidades visuales de GPT-4o con un razonamiento avanzado a través del aprendizaje por refuerzo, CUA está entrenado para interactuar con interfaces gráficas de usuario (GUIs): los botones, menús y campos de texto que las personas ven en una pantalla.
Operator puede “ver” (a través de capturas de pantalla) y “interactuar” (utilizando todas las acciones que permiten un mouse y un teclado) con un navegador, lo que le permite actuar en la web sin requerir integraciones personalizadas de API.
Aquí hay algunas funciones que soporta Operator:
Notablemente, la función puede negarse a realizar ciertas acciones que puedan causar daño o representar una amenaza potencial. Operator soporta casi todos los sitios web del protocolo HTTPS, así como algunos servicios y aplicaciones.
Al utilizar la función Operator, se lanza un navegador encriptado en la nube. Si lo desea, el usuario puede tomar el control y ajustar la tarea. En ciertas situaciones, como realizar compras en sitios web, el usuario debe confirmar la solicitud.
En EE. UU., los propietarios del plan premium ChatGPT Pro (con un precio de $200 por mes) ya han recibido acceso anticipado a Operator. En un futuro cercano, OpenAI planea expandir el soporte para los planes Plus, Team y Enterprise. La función actualmente no está disponible en la UE.
Anteriormente, informamos sobre una nueva función de IA para el foro de Reddit .