LTX Video 2.3
Lightricks · تم الإصدار May 2026
ما هو في الواقع
LTX Video 2.3 هو ما يحدث حين تسأل شركة: “ماذا لو كان نموذج الفيديو يستطيع أن يسمع أيضاً؟” Lightricks — الشركة الإسرائيلية التي تقف خلف محرر الصور Facetune الذي أطلق ألف جدل على Instagram — بنت نموذج فيديو انتشاري بـ 22 مليار معامل يفعل شيئاً لا يستطيعه أي نموذج آخر قابل للتشغيل محلياً: يُولّد فيديو وصوتاً متزامناً في تمريرة أمامية واحدة.
فكّر فيما يعنيه ذلك. تكتب أمراً نصياً يصف مشهداً — عاصفة مطرية تضرب سقفاً من الصفيح، شخصية تُلقي مونولوجاً، عزف جيتار في مقهى — والنموذج يُولّد ليس فقط الفيديو بل الصوت أيضاً. وقع المطر. صوت يتحدث. رنين الجيتار. في توليد واحد. لا نموذج صوتي منفصل. لا مزامنة يدوية. لا دعاء بأن تتطابق حركات الشفاه تقريباً مع مسار صوتي مولَّد بشكل منفصل.
يأتي النموذج بثلاث نكهات: Dev (توازن بين الجودة والسرعة)، وDistilled (مُحسَّن للتكرار السريع)، وPro (أقصى جودة، وأقصى صبر مطلوب). الثلاثة يُولّدون بدقة 1080p أصلية مع تكبير إلى 4K متاح، وجميعها تدعم مقاطع تصل إلى 20 ثانية — سخاء بمعايير النماذج المحلية. ميزة السرعة على المنافسين مثل Wan 2.1 كبيرة، خاصة مع نسخة Distilled، التي تجعل دورة التعديل السريع على الأوامر النصية وإعادة التوليد عملية فعلاً.
تفصيل مثير فعلاً: رخّصت Lightricks بيانات تدريبها من Getty Images وShutterstock بدلاً من سحب محتوى الإنترنت المفتوح. هذا لا يجعلك محصناً قانونياً — قانون حقوق النشر حول تدريب الذكاء الاصطناعي لا يزال يُكتب في المحاكم حول العالم — لكنه يُقلّل بشكل ملموس مساحة المخاطر للاستخدام التجاري. إنه الفرق بين بناء منزلك على أرض اشتريتها مقابل أرض أنت شبه متأكد أن لا أحد يملكها.
والآن، قسم الصدق. الرخصة ليست Apache 2.0. إنها رخصة Lightricks مخصصة مجانية للأفراد والشركات التي تقل إيراداتها السنوية عن 10 ملايين دولار. فوق هذا الخط، تحتاج اتفاقية تجارية. لمعظم المبدعين المستقلين والاستوديوهات الصغيرة، هذا التمييز أكاديمي — أنت مشمول. لكن إذا كنت تبني منتجاً في شركة ناشئة ممولة جيداً أو مؤسسة كبيرة، فهذا مهم. رخصة Wan 2.1 بموجب Apache 2.0 ليس لها مثل هذا السقف. اقرأ الرخصة. اقرأها فعلاً.
نقاط القوة الرئيسية
- توليد صوت وفيديو أصلي: هذه هي الميزة الرئيسية وهي فريدة حقاً بين النماذج المحلية. يُولّد LTX Video 2.3 حوارات متزامنة وموسيقى وأصوات محيطة ومؤثرات صوتية إلى جانب الفيديو في تمريرة أمامية واحدة. لا نموذج صوتي منفصل، لا خطوة مزامنة بعد المعالجة.
- الأسرع في فئته: أسرع بكثير من Wan 2.1 ونماذج الصف الأول المحلية الأخرى عند جودة مماثلة. النسخة المُقطّرة (Distilled) مُحسَّنة للتكرار السريع — مفيدة حين تُجرّب الأوامر النصية وتحتاج حلقات تغذية راجعة سريعة.
- دقة 1080p أصلية، حتى 4K: يُولّد بدقة 1080p أصلياً، مع تكبير مدمج إلى 4K. معظم النماذج المحلية المنافسة تتوقف عند 720p بدون مُكبّرات خارجية.
- بيانات تدريب مرخّصة: مُدرَّب على محتوى مرخّص من Getty Images وShutterstock. هذا لا يجعلك محصّناً قانونياً تماماً، لكنه يُقلّل مخاطر حقوق النشر بشكل ملموس مقارنة بالنماذج المُدرَّبة على فيديوهات مسحوبة من الإنترنت.
- نسخ متعددة من النموذج: اختر بين Dev (متوازن)، وDistilled (سريع)، وPro (أقصى جودة) حسب عتادك واحتياجات الجودة. يدعم إخراجاً بـ 24fps و48fps.
- حتى 20 ثانية لكل مقطع: يُولّد مقاطع تصل إلى 20 ثانية — أطول من حد 5-10 ثوانٍ لدى معظم المنافسين — ما يُقلّل الحاجة لتجميع لقطات متعددة.
-
Generation speed — Fastest in class النسخة المُقطّرة (Distilled) تُنتج فيديو بجودة الصف الأول أسرع بكثير من Wan 2.1 14B والنماذج المحلية المماثلة الأخرى. ميزة السرعة أوضح على بطاقات GPU المستهلك حيث كل ثانية من وقت التوليد مهمة.
-
Audio-video architecture — Unique (local) النموذج الوحيد القابل للتشغيل محلياً مع توليد صوت وفيديو أصلي في تمريرة واحدة. النماذج المحلية المنافسة تتطلب توليد صوت منفصل ومزامنة يدوية. Seedance 2.0 يقدم قدرة مماثلة لكنه سحابي فقط.
-
Training data provenance — Licensed بيانات التدريب مرخّصة من Getty Images وShutterstock. بين نماذج الفيديو من الصف الأول، هذا أكثر مصادر بيانات التدريب شفافية ودفاعاً قانونياً، ما يُقلّل مخاطر حقوق النشر اللاحقة للمستخدمين التجاريين.
قيود صادقة
- الرخصة ليست مفتوحة حقاً: هذا مهم وسنكون صريحين بشأنه. رخصة Lightricks مجانية للأفراد والشركات التي تكسب أقل من 10 ملايين دولار سنوياً. إذا كانت شركتك تكسب أكثر من ذلك، تحتاج اتفاقية تجارية منفصلة. هذه ليست Apache 2.0. إذا كانت الحرية التجارية المطلقة مهمة لك، فرخصة Wan 2.1 بموجب Apache 2.0 هي الخيار الأسلم.
- 22 مليار معامل تتطلب عتاداً جدياً: حد أدنى 12GB من VRAM للاستدلال المُكمَّم، و18GB لـ FP8، وأكثر من 32GB للجودة بالدقة الكاملة. هذا يعني بطاقة RTX 4090 كحد أدنى لنتائج جيدة. كلمة ‘محلي’ في توليد الفيديو المحلي تأتي مع فاتورة عتاد.
- نموذج أحدث، مجتمع أصغر: صدر في مايو 2026، ولـ LTX Video 2.3 منظومة متنامية لكنها أصغر بكثير من Wan 2.1. عُقد ComfyUI أقل، شروحات أقل، LoRAs مجتمعية أقل. سيتحسن هذا مع الوقت، لكن حالياً يتقدم Wan بفارق كبير.
- جودة توليد الصوت متفاوتة: بينما توليد الصوت والفيديو الأصلي مثير للإعجاب معمارياً، فإن جودة الصوت — خاصة للحوار — ليست بعد في مستوى نماذج تحويل النص إلى كلام المتخصصة. إنها أفضل من لا شيء وتتحسن بسرعة، لكن لا تتوقع أداءً صوتياً بمستوى هوليوود.
الحكم: LTX Video 2.3 هو النموذج الذي تختاره حين تهمك السرعة والصوت أكثر من حجم المجتمع ونقاء الترخيص. توليد الصوت والفيديو الأصلي إنجاز تقني حقيقي — سماع شخصية مولَّدة تتكلم فعلاً، مع صوت محيط يطابق المشهد، في تمريرة توليد واحدة، على عتادك الخاص، هي واحدة من تلك اللحظات التي يصل فيها المستقبل بهدوء. بيانات التدريب المرخّصة ميزة تنافسية ذكية لأي شخص قلق بشأن حقوق النشر. لكن لنكن صادقين بشأن المقايضة: الرخصة لها سقف إيرادات لا تملكه Apache 2.0، ومنظومة المجتمع لا تزال تلحق بـ Wan 2.1. إذا كنت مبدعاً فردياً أو استوديو صغيراً، فهذا يُعدّ أقدر نموذج فيديو محلي متاح اليوم. إذا كنت شركة كبيرة، اقرأ الرخصة أولاً.