Qwen-Image-2512
Локальная генерация изображенийТяжеловес среди генераторов изображений с открытым исходным кодом. Архитектура с 27 миллиардами параметров, объединяющая диффузионный трансформер с визуально-языковой моделью, создающая фотореалистичных людей и рендеринг текста на двух языках, который конкурирует с облачными сервисами — и все это под лицензией Apache 2.0, что означает, что вы владеете каждым сгенерированным пикселем.
Занимает самую высокую позицию среди моделей с открытыми весами Apache 2.0 на Arena.ai (Elo ~1,130). Фотореалистичные человеческие лица без эффекта «зловещей долины». Рендеринг текста на английском и китайском языках. Полные коммерческие права без каких-либо ограничений.
27 миллиардов параметров — это огромная нейросеть для домашнего использования. Вам понадобится RTX 4090 с квантованием INT4, чтобы уместить ее в ~14 ГБ VRAM, и даже тогда вы будете работать на пределе возможностей оборудования. Документация в основном ориентирована на китайский язык.