Lokale Bildgenerierung — Pixel ohne Genehmigung

Die leistungsfähigsten Bildgeneratoren der Welt passen jetzt auf eine einzige GPU. Keine Cloud-Konten, keine Inhaltsfilter, keine monatlichen Gebühren — nur deine Hardware und eine Intelligenz, die Text in fotorealistische Bilder verwandelt, in Sekunden. Diese Open-Weight-Modelle demokratisieren, was einst Billionen-Dollar- Unternehmen vorbehalten war.

Filter Alle Alltags-Ökosystem Bildgenerierung Programmierung App-Builder Recherche Digitale Architekten Akademische Mentoren Video Musik & Stimme Lokale / Private KI Lokale Bildgenerierung Lokale Videogenerierung KI-Agenten

Qwen-Image-2512

Lokale Bildgenerierung Alibaba (Qwen Team) · Veröffentlicht Dezember 2025
#1
8.6/10

Der Schwergewichtschampion der Open-Source-Bildgenerierung. Eine 27-Milliarden- Parameter-Architektur, die einen Diffusion Transformer mit einem Vision-Language-Modell verschmilzt und fotorealistische Menschen sowie zweisprachige Textdarstellung liefert, die es mit reinen Cloud-Diensten aufnehmen kann — alles unter Apache 2.0, was bedeutet: dir gehört jedes Pixel, das es generiert.

Bestplatziertes Apache 2.0 Open-Weight-Modell auf Arena.ai (Elo ~1.130). Fotorealistische menschliche Gesichter ohne Uncanny Valley. Zweisprachige Textdarstellung in Englisch und Chinesisch. Volle kommerzielle Rechte ohne jegliche Einschränkungen.

27 Milliarden Parameter sind eine Menge neuronales Netz zum Zuhause-Betreiben. Du brauchst eine RTX 4090 mit INT4-Quantisierung, um es auf ~14GB VRAM zu quetschen, und selbst dann bist du am Limit der Hardware. Die Dokumentation ist stark China-lastig.


Open Weight Apache 2.0 27B Photorealistic Bilingual

FLUX.2 Klein

Lokale Bildgenerierung Black Forest Labs · Veröffentlicht Anfang 2026
#2
8.5/10

Der Bildgenerator des Volkes. Vom selben Team gebaut, das Stable Diffusion erschaffen hat, packt FLUX.2 Klein den FLUX-typischen Fotorealismus in Modelle, die klein genug sind, um auf einem durchschnittlichen Gaming-Laptop zu laufen. Die 4B-Variante braucht nur 8GB VRAM — das heißt, die RTX 4060 in deinem Uni-Laptop kann jetzt studioqualitative Bilder produzieren. Apache 2.0 lizenziert.

Das zugänglichste hochqualitative lokale Modell — die 4B-Variante läuft auf 8GB VRAM. Apache 2.0 Lizenz ohne jegliche kommerzielle Einschränkungen. Erbt den FLUX-Fotorealismus. Beste Text-im-Bild-Darstellung seiner Größenklasse. Riesiges ComfyUI- und LoRA-Ökosystem.

Klein ist die Consumer-Stufe — Black Forest Labs behält die beste Qualität ihren proprietären Pro- und Max-Modellen vor. Die FLUX.2 Dev-Variante existiert, ist aber nicht kommerziell nutzbar. Klein-spezifische LoRAs wachsen noch im Vergleich zur riesigen FLUX.1-Bibliothek.


Open Weight Apache 2.0 4B/9B Fast ComfyUI LoRA

Z-Image

Lokale Bildgenerierung Alibaba Tongyi · Veröffentlicht 2026
#3
8.3/10

Der Geschwindigkeitsdämon der lokalen Bildgenerierung. Ein 6-Milliarden-Parameter- Modell, das Bilder in 8 Inferenzschritten generiert — oft unter einer Sekunde — auf so bescheidener Hardware, dass andere KI-Modelle neidisch werden. Läuft auf 6GB VRAM mit Quantisierung. Apache 2.0 lizenziert. Wenn FLUX.2 Klein die Qualität demokratisiert hat, hat Z-Image die *Geschwindigkeit* demokratisiert.

Bildgenerierung unter einer Sekunde in 8 Inferenzschritten. Läuft auf nur 6GB VRAM mit Quantisierung — das zugänglichste lokale Modell überhaupt. Apache 2.0 mit vollen kommerziellen Rechten. Mehrere spezialisierte Varianten (Turbo, Edit, Omni-Base) für verschiedene Workflows. Zweisprachige Textdarstellung in Englisch und Chinesisch.

Das neueste der drei mit dem kleinsten Community-Ökosystem. Qualität bei maximalen Einstellungen liegt leicht hinter Qwen-Image und FLUX auf ihrem Höchstniveau. Die LoRA-Bibliothek ist noch im Aufbau verglichen mit FLUX' jahrelanger Sammlung.


Open Weight Apache 2.0 6B Ultra-Fast Bilingual Sub-Second

Häufig gestellte Fragen

Qwen-Image-2512 von Alibaba belegt den Spitzenplatz unter Apache 2.0-Modellen auf Arena.ais Blind-Präferenz-Rangliste (Elo ~1.130). FLUX.2 Klein ist das zugänglichste (läuft auf 8GB VRAM), und Z-Image ist das schnellste (Generierung unter einer Sekunde).

Z-Image läuft auf nur 6GB VRAM mit Quantisierung. FLUX.2 Klein 4B braucht etwa 8GB. Qwen-Image-2512 braucht 14-24GB je nach Quantisierung. Eine RTX 3060 12GB bewältigt die meisten Modelle komfortabel.

Der Abstand ist dramatisch geschrumpft. Qwen-Image-2512 und FLUX.2 konkurrieren mit Cloud-Modellen bei Fotorealismus und Prompt-Befolgung. Wo Cloud-Dienste noch führen, ist bei der Vielfalt künstlerischer Stile und kuratierten Ästhetiken.

Sie bedeutet komplette Freiheit. Du kannst das Modell und seine Ergebnisse für jeden Zweck nutzen — privat, kommerziell oder akademisch — ohne Gebühren zu zahlen, Erlaubnis einzuholen oder die Ersteller zu nennen (obwohl Nennung geschätzt wird). Alle drei Modelle in dieser Kategorie nutzen Apache 2.0.