LTX 2.3

By Lightricks · Updated

Offizielle Website

Was es wirklich ist

LTX 2.3 ist Lightricks’ Open-Source-Schachzug gegen jede geschlossene Video-API: ein Diffusion-Transformer mit 22 Milliarden Parametern, der kinoqualitative Videos und synchronisierten Ton aus einem einzigen Text- oder Bild-Prompt generiert — und das auf Ihrer eigenen Hardware. Kein Abo. Keine Credits. Keine Content-Filter, die bestimmen, was Sie erstellen dürfen. Das Modell produziert bis zu 20-Sekunden-Clips in nativem 1080p mit integrierten Soundeffekten, Dialogen und Umgebungsaudio in einem einzigen Durchlauf. 4K benötigt? Eine zweistufige Upscaling-Pipeline macht es möglich. Der gesamte Stack ist Open-Weight unter Apache 2.0, mit ComfyUI-Unterstützung ab Tag eins und einer eigenständigen Desktop-App. Zum ersten Mal kann ein lokales Videomodell ernsthaft mit den Cloud-Giganten konkurrieren.

Zentrale Stärken

  • Native Audio-Video-Synchronisation: Generiert perfekt abgestimmten Sound — Dialog, Umgebungsgeräusche, Effekte — in einem Vorwärtsdurchlauf. Keine separaten Pipelines, keine Nachbearbeitung.
  • Vollständig Open-Source (Apache 2.0): Volle kommerzielle Nutzung, lokaler Betrieb und Fine-Tuning erlaubt. Ihre GPU, Ihre Regeln.
  • Redesignter VAE: Schärfere Texturen, sauberere Kanten und realistischere Feindetails im Vergleich zu früheren Open-Source-Videomodellen.
  • Schnelle destillierte Variante: Das 8-Schritt-Modell läuft extrem schnell auf Consumer-GPUs (RTX 3090+), was Echtzeit-Iteration ermöglicht.
  • Nativer Hochformatmodus: 1080×1920-Ausgabe direkt für Mobile-First- und Social-Media-Inhalte ohne Cropping oder Letterboxing.

Ehrliche Einschränkungen

  • Hinter geschlossenen Führern bei Wiedergabetreue: Kling 3.0 und Seedance 2.0 produzieren in komplexen Szenen weiterhin poliertere, physikalisch präzisere Ergebnisse.
  • Audio-Artefakte: Gelegentliches Durchbluten von Hintergrundmusik, Zeitlupendrift bei längeren Clips und kleinere visuelle Glitches in anspruchsvollen Szenen.
  • Multi-Shot-Timing: Komplexe Multi-Szenen-Prompts können ungleichmäßiges Pacing erzeugen; iterative Generierung plus Zusammenschnitt liefert die besten Ergebnisse.
  • 4K ist VRAM-hungrig: Die zweistufige Upscaling-Pipeline erfordert ernsthaften GPU-Speicher. Einphasige Ausgaben sind auf 1080p begrenzt.

Das Fazit: Der beste Open-Source-Videogenerator auf dem Markt. LTX 2.3 wird Kling oder Seedance beim rohen Hollywood-Feinschliff nicht enthronen, aber für Indie-Filmemacher, Marketer und Bastler, die volle Kontrolle, null laufende Kosten und datenschutzorientierte Workflows wollen — ist es ein absoluter Game-Changer. Dass es synchronisierten Ton lokal generiert, auf der eigenen Maschine, unter einer permissiven Lizenz, ist wirklich beispiellos.