Qwen-Image-2512
توليد الصور المحليبطل الوزن الثقيل في توليد الصور مفتوحة المصدر. بنية بـ 27 مليار معامل تدمج محول انتشاري مع نموذج لغوي بصري، لتُنتج بشراً واقعيين فوتوغرافياً ونصوصاً ثنائية اللغة تنافس الخدمات السحابية الحصرية — كل ذلك تحت Apache 2.0، ما يعني أنك تملك كل بكسل يُولّده.
أعلى نموذج مفتوح الأوزان بترخيص Apache 2.0 تصنيفاً على Arena.ai (بتقييم Elo حوالي 1,130). وجوه بشرية واقعية فوتوغرافياً بلا وادي الغرابة. عرض نصوص ثنائية اللغة بالإنجليزية والصينية. حقوق تجارية كاملة بلا قيود.
27 مليار معامل يعني شبكة عصبية ضخمة لتشغيلها منزلياً. ستحتاج بطاقة RTX 4090 مع تكميم INT4 لتضغطها في حوالي 14GB من VRAM، وحتى ذلك تدفع عتادك للحد الأقصى. التوثيق يميل بشدة نحو الصينية أولاً.