OpenAI introduceert Operator, een AI-agent die zelfstandig webtaken kan uitvoeren zoals formulieren invullen en boodschappen bestellen. Het gebruikt een eigen browser en kan ‘zien’ en reageren op webpagina’s dankzij het Computer-Using Agent (CUA) model. Het combineert de capaciteiten van GPT-4o met redenering, waardoor Operator taken kan uitvoeren zonder API-integraties.
Operator bevindt zich in momenteel nog in een onderzoekspreview en is beschikbaar voor Pro-gebruikers in de VS. Gebruikers geven instructies en Operator voert de taken uit, waarbij de controle teruggegeven wordt aan de gebruiker voor handelingen zoals inloggen of betalen. De AI-agent kan worden gepersonaliseerd met aangepaste instructies en kan meerdere taken tegelijk uitvoeren.
Als het problemen ondervindt of fouten maakt, kan Operator zijn redeneervermogen gebruiken om zichzelf te corrigeren. Wanneer het model vastloopt en hulp nodig heeft, geeft het de controle gewoon terug aan de gebruiker. Het transformeert AI daarmee van een passief hulpmiddel naar een actieve deelnemer in het digitale ecosysteem.
Hoewel CUA zich nog in een vroeg stadium bevindt en (dus) beperkingen heeft, zet het nieuwe benchmarkresultaten neer in WebArena en WebVoyager, twee belangrijke indicators voor browsergebruik.
OpenAI werkt samen met verschillende bedrijven, waaronder DoorDash en Instacart, om Operator te optimaliseren en aan te passen aan de behoeften van de consument. Het doel is om de efficiëntie te verhogen en tijd te besparen voor zowel individuen als organisaties.