لوميير Lumiere: نموذج ذكاء من Google يحدث ثورة في صناعة الأفلام

جوجل لوميير، جوجل اعلنت عن أحدث نماذجها للذكاء الاصطناعي وهو نموذج Lumiere النموذج ده بتقدر من خلاله تحول النصوص الى مقاطع فيديو قصيرة، وكمان بتقدر تحرك الصور أو تحريك اجزاء معينة بداخلها بالاضافة انك هتقدر تعدل في مقاطع الفيديو.

جوجل قالت ان النموذج ده بيولد المقاطع في عملية واحدة مش بيبدأ بتوليد الاطارات الثابتة الاول علشان يحركها بشكل متتابع في عملية تانية زي ماهو موجود في النماذج المنافسة لتوليد الفيديو وبكدا هو متميز في جودة التحريك في المقاطع مقارنة بالنماذج التانية.

لوميير Lumiere: نموذج ذكاء صنعي جديد من Google يحدث ثورة في صناعة الأفلام

جوجل استخدمت اكتر من 30 مليون مقطع لتدريب نموذج Lumiere بالاضافة إلى مقتطفات نصية تصف محتوى كل مقطع حتى يتمكن النموذج من تعلم الأنماط المختلفة.

في السابع والعشرين من يناير، أعلنت Google عن أحدث نموذج لها في مجال الذكاء الاصطناعي، والذي يحمل اسم "لوميير". هذا النموذج الجديد يأتي بقدرات فائقة، إذ يمتاز بإمكانية تحويل النصوص والصور إلى فيديوهات واقعية ومتنوعة، مما يجعله يتفوق على النماذج السابقة في هذا المجال.

كيف يقوم جوجل لوميير بإنشاء الفيديوهات؟

يوفر لوميير إمكانية تحريك الصور القائمة وإنشاء فيديوهات بتنسيق الصورة الأصلية. كما يتيح أيضاً إمكانية إضافة فيديو داخل الصورة وإنشاء رسوم متحركة في أقسام معينة داخل الصورة.

تقدم بحث Google المعنون "لوميير: نموذج انتشار المكان والزمان لتوليد الفيديو" التفاصيل العلمية وراء عمل لوميير. يقول الملخص: "نقدم لوميير - نموذج انتشار المكان والزمان المصمم لتوليد مقاطع الفيديو التي تصور حركة واقعية ومتنوعة ومتماسكة - تحديًا حاسمًا في توليد الفيديو. في هذا السياق، نقدم هندسة Space-Time U-Net التي تولد مدة الفيديو الزمنية بأكملها في مرة واحدة، من خلال مرور واحد في النموذج."

الابتكار الرئيسي هو نموذج انتشار SpaceTime الذي يولد مدة الفيديو الزمنية بأكملها في مرة واحدة، مقارنة بالنماذج الحالية التي تولد إطارات رئيسية بعيدة تلو الأخرى. يهدف Google من خلال لوميير إلى تحقيق تمثيل زمني عالمي يضمن التمثيل المتماسك عبر إطارات مختلفة.

تجارب مذهلة مع لوميير

تم توضيح قدرات لوميير في البحث من خلال أمثلة متنوعة. تظهر نتائج تحويل النصوص إلى فيديوهات تحفظ تنوعاً ودقة ملحوظة في تصوير مشاهد متنوعة. وبالمقارنة، يبدو أن تحويل الصور إلى فيديوهات يظهر أيضاً رسومًا متحركة رائعة. وعلاوة على ذلك، ينتج استخدام النموذج لتوليد رسوم متحركة بأسلوب معين نتائج بصرية جذابة ومتماسكة.

لماذا يهم هذا الأمر؟

في الورقة البحثية، قام الفريق بمقارنة أداء النموذج الذكي مع نماذج أخرى متقدمة في صناعة تحويل النصوص إلى فيديوهات والصور إلى فيديوهات. واستنادًا إلى النتائج، يبدو أن جوجل لوميير يتفوق في جودة الفيديو وتوجيه النصوص.

على الرغم من قدرة هذا النموذج على إثارة الإعجاب بقدراته، يمكن أن يكون الاستخدام المحتمل لهذا التكنولوجيا الجديدة هو تمكين الأفراد من إنتاج أفلام ذات طابع هوليوودي بسهولة.

فقد كانت المجتمعات المتخصصة في مجال الذكاء الاصطناعي تبحث في كيف يمكن لهذه النماذج توليد صور وفيديوهات لتطوير نماذج عالمية للمحاكاة المتقدمة. يبدو أن لوميير يفتح الباب أمام تطورات وأبحاث أكثر. إنها خطوة هامة في توليد الفيديو بواسطة الذكاء الاصطناعي، مما يقدم إمكانيات إبداعية واسعة. النتائج المتسقة والواقعية المعروضة في الأمثلة تشير إلى إمكانية تحقيق تقدم ثوري في مجال محتوى الذكاء الاصطناعي.

في الختام، أكد الفريق في استنتاجهم أن هدفهم الرئيسي في هذا العمل هو تمكين المستخدمين الجدد من إنتاج محتوى بصري بطريقة إبداعية ومرنة. واعترفوا بوجود مخاطر إساءة استخدام هذه التكنولوجيا الجديدة، مشيرين إلى أهمية تطوير وتطبيق أدوات لاكتشاف التحيزات والاستخدامات الضارة لضمان استخدام آمن وعادل.

يجدر بالذكر أنه حتى الآن، لا يمكن الوصول إلى أو تنزيل لوميير. ومع ذلك، يعتقد الخبراء أن لوميير سيعزز قدرات محرك البحث الخاص بـ Google Bard في المستقبل. حتى الآن، لا توجد إشارة رسمية بعد إلى أن نموذج الذكاء الاصطناعي سيدمج في Bard.

تابع ايضا:

اكتشاف أماكن جديدة مع مزايا خرائط جوجل المحسّنة عبر الذكاء الاصطناعي - خرائط جوجل تقدم تحديثات جديدة باستخدام الذكاء الاصطناعي لاكتشاف أماكن جديدة وتحسين تجربة المستخدم.

ميزة Ask Photos من جوجل: البحث في ألبوم الصور باستخدام الذكاء الاصطناعي - جوجل تطلق ميزة "Ask Photos" التي تتيح للمستخدمين البحث في ألبومات الصور باستخدام الذكاء الاصطناعي.

موقع Remove.bg يطلق ميزة إضافة الظلال بالذكاء الاصطناعي - موقع Remove.bg يضيف ميزة جديدة بالذكاء الاصطناعي لإضافة الظلال بشكل تلقائي على الصور.

تطوير نموذج Gemini Pro: ثورة في الذكاء الاصطناعي 40 لغة إضافية - جوجل تطور نموذج "جمني برو" الذي يدعم 40 لغة جديدة باستخدام تقنيات الذكاء الاصطناعي.