OpenAI kann jetzt autonom buchen und shoppen
- Operator automatisiert Aufgaben wie Buchungen und Online-Shopping auf ChatGPT Pro
- OpenAI nutzt das CUA-Modell für Interaktionen wie ein Mensch auf Webseiten
- Nutzer behalten Kontrolle: Operator erfordert Bestätigung bei sensiblen Aktionen
OpenAI hat mit Operator seinen ersten KI-Agenten vorgestellt, der Aufgaben autonom erledigt, berichtet TechCrunch. Der Dienst startet zunächst als Forschungsvorschau für US-Nutzer des ChatGPT Pro-Plans. Operator ermöglicht es, Aufgaben wie Reisebuchungen, Restaurantreservierungen oder Online-Einkäufe zu automatisieren. Dabei verwendet der Agent ein dediziertes Browserfenster und agiert ähnlich wie ein Mensch: Er navigiert Menüs, klickt auf Buttons und füllt Formulare aus.
Das zugrunde liegende Computer-Using-Agent (CUA)-Modell kombiniert die visuelle Erkennung des GPT-4o-Modells mit fortschrittlicher Logik. Dadurch kann Operator ohne spezielle APIs mit Webseiten interagieren. Nutzer behalten die Kontrolle, da Operator vor finalen Aktionen wie Bestellungen oder dem Versenden von E-Mails eine Bestätigung einholt. Sensible Aufgaben, etwa das Eingeben von Kreditkartendaten, erfordern aktive Nutzerüberwachung. Trotz innovativer Ansätze hat Operator einige Einschränkungen. Er kann komplexe Aufgaben wie das Verwalten von Kalendern oder das Bearbeiten von CAPTCHAs nicht zuverlässig ausführen. Sicherheitsmaßnahmen wie Nutzungsbeschränkungen und ein Monitoring-System minimieren Missbrauchsrisiken.
Mit Operator macht OpenAI einen mutigen Schritt in Richtung autonomer KI-Agenten, die über reine Informationsverarbeitung hinausgehen. Die kommende Integration in ChatGPT-Clients könnte die Art und Weise, wie wir KI im Alltag nutzen, nachhaltig verändern.