Découvrez Operator d'OpenAI, un agent IA qui réinvente l'automatisation des tâches web. Capable de remplir des formulaires, réserver des voyages ou créer des mèmes, cet outil basé sur GPT-4 interagit de manière autonome avec les navigateurs. Un pas en avant dans l'automatisation grâce à l'IA.

OpenAI a dévoilé une préversion de Operator, un nouvel outil conçu pour moderniser le concept de l’automatisation des processus robotisés (RPA). Cet agent IA est capable de prendre le contrôle d’un navigateur web et d’exécuter diverses actions de manière autonome, ouvrant la voie à l’automatisation des tâches du quotidien.
Operator est un agent IA polyvalent capable d’automatiser des tâches telles que remplir des formulaires, réserver des voyages, voire créer des mèmes. Il interagit avec un navigateur web de la même manière qu’une personne, en utilisant des clics de souris, des défilements et des saisies au clavier. Cette approche rappelle l'outil Computer Use d'Anthropic (partie de Claude 3.5 Sonnet), qui simule également les mouvements de souris et les frappes au clavier. Google travaille aussi sur Project Mariner dans Gemini 2.0, avec des objectifs similaires à ceux d’OpenAI.
Basé sur GPT-4, Operator utilise un modèle appelé Computer-Using Agent (CUA). Il interprète des captures d'écran et suit les instructions de l’utilisateur, comme "Réserver un vol" ou "Commander des courses". L'agent effectue les étapes nécessaires, mais s'il rencontre un obstacle tel qu'un CAPTCHA ou un champ de mot de passe, il interrompt l’action et demande à l’utilisateur d’intervenir, lui permettant ainsi de garder le contrôle.
L’une des fonctionnalités pratiques d’Operator est l'enregistrement des prompts sur la page d’accueil pour un accès rapide. Cependant, OpenAI précise que l’outil reste limité pour les tâches complexes ou spécialisées, telles que la création de présentations détaillées ou l’interaction avec des interfaces non standard.
Parmi les cas d’utilisation mis en avant par OpenAI, on trouve les réservations de voyages, de restaurants, et les commandes en ligne. L'éditeur travaille avec plusieurs entreprises, notamment OpenTable, StubHub, Instacart, DoorDash et Uber, pour améliorer les capacités de l'outil et étendre son intégration avec différents services.
En résumé, Operator d'OpenAI représente une avancée prometteuse dans l'automatisation des tâches numériques, offrant une nouvelle dimension dans le domaine de l'IA et de l'automatisation des processus.
Source : ICTjournal