Connect with us

Tecnologia

Operador ChatGPT: la nueva IA capaz de navegar por internet como un humano

Published

on


Esta nueva IA de ChatGPT tiene la capacidad de navegar por la web de forma autónoma. REUTERS/Dado Ruvic/

Imagina que necesitas reservar un velo en una página web. Normalmente, esto implicaría buscar fechas, seleccionar horarios, completar datos personales y realizar el pago. Ahora, con ChatGPT Operador, puede delegar esta tarea.

El usuario debe ingresar en esta Iowa dar la indicación para que el agente abra una página de vuelosanaliza los elementos visuales como calendarios, menús desplegables y formularios, y realiza todas las acciones necesarias.

Si encuentra un CAPTCHA o requiere información confidencial, como los datos de su tarjeta de crédito, pausará la operación y solicitará confirmación antes de continuar.

Operador ChatGPT frena sus operaciones
ChatGPT Operador frena sus operaciones si es necesario ingresador una contraseña. (AI abierta)

Este nivel de autonomía es posible gracias al modelo Computer-Using Agent (CUA) desarrollado por OpenAI, que utiliza las capacidades del modelo de inteligencia artificial GPT-4o.

ChatGPT Operador no solo comprende los elementos de la pantalla a partir de los píxeles, sino que también utiliza un teclado y un mouse virtuales para navegar a través de interfaces gráficas de usuario (GUI), lo que permite a las personas completar tareas que antes solo podían hacer las personas. Esta IA está disponible para usuarios Pro en Estados Unidos.

ChatGPT funciona gracias al modelo CUA que procesa la información directamente desde la pantallainterpretando los elementos visuales, como botones, menús y campos de texto. Esta capacidad le permite interactuar con entornos digitales sin API especializadas, ampliando sus aplicaciones.

Una de las características principales de este agente es su capacidad para descomponer tareas en pasos pequeños.

La IA es capaz de
La IA es capaz de comprender la información de la pantalla. (Imagen Ilustrativa Infobae)

Por ejemplo, al reservar un veelo, primero buscaría las fechas disponibles, luego seleccionaría la mejor opción según las preferencias del usuario, completaría las fórmulas y revisaría los detalles antes de proceder al pago. En caso de un error, como un campo obligatorio que no estaba previsto, se autocorregiría y se adaptaría para completar la tarea.

A diferencia de otros sistemas que dependen exclusivamente de configuraciones específicas, ChatGPT Operador interactúa directamente con los elementos gráficos en pantalla, imitando la experiencia humana. Por ejemplo, al navegar en un sitio web, puede identificar opciones en menús desplegables, hacer clic en botones de usuario y desplazarse por la página, todo como lo haría un real.

Si está explorando recetas de cocina en línea y desea recopilar automáticamente las listas de ingredientes de varios sitios web, ChatGPT Operador puede visitar las páginas, identificar los ingredientes y organizarlos en un archivo para referencia del usuario.

El operador ChatGPT está disponible para
ChatGPT Operador está disponible para usuarios Pro en los Estados Unidos. REUTERS/Dado Ruvic/Ilustración/Foto de archivo

ChatGPT Operador, el agente autónomo de OpenAI, ha sido desarrollado con un enfoque en la seguridad para proteger tanto a los usuarios como al entorno digital, según la empresa tecnológica.

Este modelo está diseñado para rechazar aplicaciones que puedan implicar actividades dañinas, ilegales o inapropiadas..

Durante la ejecución de tareas, el sistema es capaz de detectar actividades sospechosas. Si identifica algún riesgo, como contenido fraudulento en una página web, pausa su operación y alerta al usuario antes de proceder. “El operador está capacitado para garantizar que la persona que lo utiliza siempre tiene el control y solicita información en puntos críticos”, explica OpenAI.

La inteligencia artificial no pueden
La inteligencia artificial no puede completar un Captcha. (Google)

Para acciones críticas, como ingresar credenciales, resolver fórmulas CAPTCHA o realizar transacciones financieras, el modelo requiere la confirmación explícita del usuario, reduciendo riesgos y garantizando transparencia.

Aunque OpenAI ha destacado las capacidades del Operador ChatGPT, esta función se encuentra en una fase de prueba y aún no se ha implementado por completo a nivel global. Actualmente, su disponibilidad está limitada a suscriptores del nivel Pro en Estados Unidos.

A pesar de las medidas, OpenAI reconoce que el modelo está en desarrollo y sigue trabajando en la mejora de sus capacidades de protección y supervisión.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Copyright © 2024 DESOPINION.COM

WP Twitter Auto Publish Powered By : XYZScripts.com