print logo

Cloudinary erweitert Bild- und Video-APIs mit generativer KI

Neue Funktionen ermöglichen es Kreativ- und Entwicklungs-Teams, schneller zu innovieren und maßgeschneiderte Bilder und Videos bereitzustellen
Cloudinary | 21.06.2023
Generative Remove entfernt unerwünschte Elemente aus Bildern © Cloudinary
 

Cloudinary hat heute die Verfügbarkeit mehrerer neuer Funktionen für generative KI, Large Language Models (LLM) und GPT bekannt gegeben. Die Funktionen wie Generative Fill, Generative Remove, Generative Replace, KI-basierte Bildunterschriften und eine ChatGPT-basierte Schnittstelle für natürliche Sprache sind ab sofort als Bild- und Video-APIs im Rahmen des Programmable Media-Angebots von Cloudinary verfügbar. Sie ermöglichen es Nutzern, maßgeschneiderte, personalisierte Assets in Sekundenschnelle zu erstellen und helfen Entwicklungs-Teams, schnell zu skalieren, indem Workflows intelligent automatisiert und sich wiederholende, zeitaufwendige Bildbearbeitungsaufgaben eliminiert werden. 

Ferner ermöglichen die neuen Funktionen, dynamische visuelle Erlebnisse in bisher nicht gekanntem Umfang zu erstellen, zu bearbeiten und bereitzustellen. Anstatt etwa eine ganze Kampagne neu zu fotografieren, können Entwicklungs- und digitale Marketing-Teams die APIs von Cloudinary nutzen, um unerwünschte Objekte zu entfernen und ansprechende Bilder in großem Maßstab zu erstellen. In ähnlicher Weise erstellt die KI intelligente Bildunterschriften, um die Zugänglichkeit und Durchsuchbarkeit von Assets sowie die Suchmaschinenoptimierung zu verbessern und gleichzeitig die Produktivität zu steigern und die Produktionszeit zu verkürzen. 

Neue Funktionen vereinfachen und automatisieren den Workflow für visuelle Inhalte

  • Generative Remove: Über Eingabeaufforderungen in natürlicher Sprache können Benutzer unerwünschte Elemente aus Bildern entfernen und automatisch einen passenden Hintergrund hinzufügen. Die neue Funktion nutzt modernste Technologien wie Open-Set-Objekterkennungsmodelle und leistungsstarke KI-Funktionen durch Stable Diffusion.
  • Generative Fill: Ermöglicht Benutzern die einfache Verbesserung und Erweiterung eines Bildes. Zum Beispiel kann ein Originalbild auf intelligente Weise erweitert und gestreckt werden, was besonders nützlich ist, wenn ein Bild von der Vertikalen in die Horizontale umgewandelt werden soll. Dank generativer Füllung fügt sich der neue KI-generierte Hintergrund nahtlos in das Originalbild ein.
  • Generatives Replace: Ermöglicht Benutzern das einfache Erkennen, Ändern und Ersetzen unerwünschter Elemente und Farben über Anweisungen in natürlicher Sprache. Diese Funktion ist besonders nützlich für Benutzer, die Farbvarianten von Produkten erstellen oder die Barrierefreiheit für Menschen mit Farbsehschwäche verbessern möchten.
  • KI-unterstützte Bildunterschriften: Ermöglicht die intelligente Erstellung von Bildunterschriften für Bildergalerien, benutzergenerierte Inhalte und umfangreiche Produktbeschreibungen. Die Bild-zu-Text-Funktionen verbessern die Suchmaschinenoptimierung von Bildern, die Barrierefreiheit und automatisieren die Bildklassifizierung für eine bessere Auffindbarkeit. Ferner sparen E-Commerce-Nutzer durch die automatische Erstellung intelligenter Produktbeschreibungen Zeit.
  • Conversational Transformations Builder: Diese leistungsstarke Funktion bietet über ChatGPT eine natürlichsprachliche Schnittstelle, über die die Benutzer auf einfache Weise gewünschte Bildtransformationen und -optimierungen mitteilen können. Eine einfache Anweisung wie „Bitte dieses Bild weichzeichnen und auf ein Seitenverhältnis von 1:1 zuschneiden“ liefert eine vollständige und korrekte Transformation.

„Es ging immer darum, dass fortschrittliche Technologien mühsame Aufgaben rationalisieren, damit Unternehmen ihre begrenzten Ressourcen für die Erstellung effektiver und visuell ansprechender Websites, Apps und Kampagnen einsetzen können“, sagte Nadav Soferman, Mitbegründer und Chief Product Officer von Cloudinary. „Wir freuen uns sehr, dass diese leistungsstarken neuen generativen KI-Funktionen nun Unternehmen dabei helfen, ihre besten visuellen Geschichten zum Leben zu erwecken – und das ist erst der Anfang.“