China stellt aktuell besten Videogenerator vor
- Kling generiert 1080p Videos bis zu zwei Minuten mit realistischen Bewegungen
- Kuaishou's Kling übertrifft OpenAI's Sora in der Videoqualität und -länge
- Nutzung von Diffusion Transformer Architektur für lebendige visuelle Darstellungen.
Im Februar dieses Jahres stellte OpenAI sein Video-Generierungsmodell Sora vor, das einminütige HD-Videos erstellen kann. Nun sorgt Kuaishou Technology, ein chinesisches Unternehmen, mit seinem neuen Text-zu-Video-Modell Kling für Schlagzeilen. Kling ist in der Lage, 1080p-Videos mit einer Länge von bis zu zwei Minuten zu erstellen und übertrifft damit Soras Kapazitäten. Kling erzeugt realistische Bewegungen, die physikalische Eigenschaften der realen Welt simulieren, so The Indian Express.
Am Donnerstag veröffentlichte Kuaishou ein Demovideo, das die Fähigkeiten von Kling demonstriert. Derzeit ist das Modell auf Einladung über die Kuaiying-App, eine Videoaufnahme- und Bearbeitungsapp von Kuaishou, zugänglich. AI-Enthusiasten haben ihre mit Kling erstellten Videos auf sozialen Medien geteilt, und die Ergebnisse zeigen eine beeindruckende Genauigkeit bei der Simulation realer physischer Eigenschaften.
Kling basiert auf der Diffusion Transformer Architektur und kann Textanweisungen in lebendige visuelle Darstellungen umsetzen. Mit der fortschrittlichen 3D-Gesichts- und Körperrekonstruktionstechnologie 3D VAE von Kuaishou können Nutzer Videos in verschiedenen Seitenverhältnissen erstellen. Dies wird durch variable Auflösungstraining ermöglicht, das vollständige Bewegungen und Ausdrucksmöglichkeiten aus einem einzigen Ganzkörperfoto zulässt.