print logo

ChatGPT versteht Live-Video

OpenAI bringt Advanced Voice Mode mit Vision: KI erkennt Objekte, löst Probleme und bietet Screen-Sharing.
17.12.24

- ChatGPT kann jetzt in Echtzeit Videos analysieren und Objekte erkennen
- Neue visuelle Funktionen sind nur für Plus-, Team- und Pro-Abonnenten verfügbar
- Rollout für Enterprise- und EU-Nutzer ist erst ab Januar 2024 geplant

OpenAI hat ChatGPT um visuelle Fähigkeiten erweitert und den Advanced Voice Mode mit Echtzeit-Videoanalyse eingeführt, berichtet TechCrunch. Nutzer mit Plus-, Team- oder Pro-Abonnements können die Funktion verwenden, um Objekte mit ihrer Smartphone-Kamera zu scannen und sofortige Antworten zu erhalten. Zusätzlich bietet ChatGPT jetzt die Möglichkeit, Bildschirminhalte über Screen-Sharing zu erklären. Damit lassen sich komplexe Aufgaben wie das Lösen mathematischer Probleme oder das Navigieren durch Geräteeinstellungen effizienter bewältigen. Die neuen Funktionen sollen eine interaktivere und alltagstauglichere Nutzung des KI-Systems ermöglichen.

Der Rollout dieser visuellen Erweiterung beginnt schrittweise und soll innerhalb einer Woche abgeschlossen sein. Allerdings bleiben bestimmte Nutzergruppen, darunter Enterprise- und Bildungsabonnenten, vorerst ausgeschlossen – sie erhalten erst im Januar 2024 Zugriff. Auch Nutzer in der EU sowie in Norwegen, Island, der Schweiz und Liechtenstein können die Funktion derzeit nicht nutzen. Diese Einschränkungen unterstreichen regulatorische und technische Herausforderungen, denen OpenAI bei der Einführung innovativer Technologien begegnet.

Die neue Funktion hebt ChatGPT auf ein höheres Niveau der Mensch-KI-Interaktion, birgt jedoch weiterhin Schwächen, wie vereinzelte Fehler in der visuellen Analyse zeigen. Während OpenAI sich auf die Optimierung der Funktionen konzentriert, arbeiten auch Wettbewerber wie Google und Meta an ähnlichen Technologien. Mit diesem Update stärkt OpenAI seine Position im Rennen um die fortschrittlichsten KI-gestützten Kommunikationsplattformen und erweitert die Einsatzmöglichkeiten von ChatGPT erheblich.