Локальная генерация изображений — Пиксели без разрешения

Самые мощные генераторы изображений в мире теперь помещаются на одном графическом процессоре. Никаких облачных учетных записей, никаких фильтров контента, никакой ежемесячной платы — только ваше оборудование и интеллект, который превращает текст в фотореалистичные изображения за секунды. Эти модели с открытыми весами демократизируют то, что когда-то было эксклюзивом компаний стоимостью в триллион долларов.

Фильтр Все Повседневная экосистема Генерация изображений Программирование Создание приложений Исследования Цифровые архитекторы Академические наставники Видео Музыка и голос Локальный / Приватный ИИ Локальная генерация изображений Локальная генерация видео ИИ-агенты

Qwen-Image-2512

Локальная генерация изображений Alibaba (Qwen Team) · Выпущено Декабрь 2025 г.
#1
8.6/10

Тяжеловес среди генераторов изображений с открытым исходным кодом. Архитектура с 27 миллиардами параметров, объединяющая диффузионный трансформер с визуально-языковой моделью, создающая фотореалистичных людей и рендеринг текста на двух языках, который конкурирует с облачными сервисами — и все это под лицензией Apache 2.0, что означает, что вы владеете каждым сгенерированным пикселем.

Занимает самую высокую позицию среди моделей с открытыми весами Apache 2.0 на Arena.ai (Elo ~1,130). Фотореалистичные человеческие лица без эффекта «зловещей долины». Рендеринг текста на английском и китайском языках. Полные коммерческие права без каких-либо ограничений.

27 миллиардов параметров — это огромная нейросеть для домашнего использования. Вам понадобится RTX 4090 с квантованием INT4, чтобы уместить ее в ~14 ГБ VRAM, и даже тогда вы будете работать на пределе возможностей оборудования. Документация в основном ориентирована на китайский язык.


Open Weight Apache 2.0 27B Photorealistic Bilingual

FLUX.2 Klein

Локальная генерация изображений Black Forest Labs · Выпущено Начало 2026 г.
#2
8.5/10

Народный генератор изображений. Созданный той же командой, что и Stable Diffusion, FLUX.2 Klein упаковывает фотореализм семейства FLUX в модели, достаточно маленькие для работы на игровом ноутбуке среднего класса. Варианту 4B требуется всего 8 ГБ видеопамяти — это означает, что RTX 4060 в вашем студенческом ноутбуке теперь может создавать изображения студийного качества. Лицензия Apache 2.0.

Самая доступная из высококачественных локальных моделей — вариант 4B работает на 8 ГБ VRAM. Лицензия Apache 2.0 без коммерческих ограничений. Наследует фотореализм FLUX. Лучший в своем классе рендеринг текста на изображениях для своего размера. Массивная экосистема ComfyUI и LoRA.

Klein — это потребительский уровень: Black Forest Labs оставляет лучшее качество для своих проприетарных моделей Pro и Max. Существует вариант FLUX.2 Dev, но он некоммерческий. Специфичных для Klein LoRA-моделей пока не так много по сравнению с огромной библиотекой FLUX.1.


Open Weight Apache 2.0 4B/9B Fast ComfyUI LoRA

Z-Image

Локальная генерация изображений Alibaba Tongyi · Выпущено 2026 г.
#3
8.3/10

Демон скорости локальной генерации изображений. Модель с 6 миллиардами параметров, которая генерирует изображения за 8 шагов вывода — часто менее чем за секунду — на оборудовании настолько скромном, что другие ИИ-модели завидуют. Работает на 6 ГБ VRAM с квантованием. Под лицензией Apache 2.0. Если FLUX.2 Klein демократизировал качество, то Z-Image демократизировал *скорость*.

Генерация изображения менее чем за секунду за 8 шагов вывода. Работает всего на 6 ГБ VRAM при квантовании — самая доступная локальная модель, точка. Apache 2.0 с полными коммерческими правами. Несколько специализированных вариантов (Turbo, Edit, Omni-Base) для разных рабочих процессов. Двуязычный рендеринг текста на английском и китайском языках.

Новейшая из трех с самой маленькой экосистемой сообщества. Качество на максимальных настройках немного уступает Qwen-Image и FLUX в их лучших проявлениях. Библиотека LoRA все еще находится в зачаточном состоянии по сравнению с многолетней коллекцией FLUX.


Open Weight Apache 2.0 6B Ultra-Fast Bilingual Sub-Second

Часто задаваемые вопросы

Qwen-Image-2512 от Alibaba занимает самое высокое место среди моделей с лицензией Apache 2.0 в таблице лидеров слепых предпочтений Arena.ai (Elo ~1130). FLUX.2 Klein — самая доступная (работает на 8 ГБ VRAM), а Z-Image — самая быстрая (генерация менее чем за секунду).

Z-Image работает всего на 6 ГБ VRAM с квантованием. FLUX.2 Klein 4B требует около 8 ГБ. Qwen-Image-2512 требует 14-24 ГБ в зависимости от квантования. RTX 3060 12 ГБ комфортно справляется с большинством моделей.

Разрыв кардинально сократился. Qwen-Image-2512 и FLUX.2 конкурируют с облачными моделями по фотореалистичности и соблюдению промптов. В чем облачные сервисы всё ещё лидируют, так это в разнообразии художественных стилей и выверенной эстетике.

Она означает полную свободу. Вы можете использовать модель и её результаты для любых целей — личных, коммерческих или академических — без оплаты сборов, запроса разрешения или указания авторства создателей (хотя упоминание приветствуется). Все три модели в этой категории используют Apache 2.0.