כאשר OpenAI הכריזה על Sora, כלי מופעל בינה מלאכותית שהופך תיאורי טקסט לסרטונים, היא הפכה במהירות לסנסציה עולמית בגלל התוצאות המרגשות שלו. המתחרים הקרובים ביותר, Pika Labs ו-RunwayML היו בפיגור משמעותי מבחינת האיכות והקוהרנטיות בהנחיית הטקסט.
אולי סיבה אחת היא שמחוללי וידאו AI דורשים כמות משמעותית של כוח מחשוב כדי לפעול. Sora דורשת שמונה יחידות עיבוד גרפיות (GPU) של NVIDIA A100 הפועלות במשך יותר משלוש שעות כדי להפיק קליפ של דקה אחת!! NVIDIA A100 אחד עולה מעל 10,000 דולר.
אבל היום, לסורה אולי סוף סוף יש מתחרה אמיתי – סין חשפה זה עתה את כלי הבינה המלאכותית המחולל טקסט לווידאו, בשם: Vidu.
מה זה Vidu?
Vidu הוא מודל AI של טקסט לווידאו שפותח על ידי סטארט-אפ AI הסינית ShengShu Technology ואוניברסיטת Tsinghua. הוא הוכרז ב-27 באפריל 2024, והוא נועד ליצור סרטוני HD של 16 שניות ברזולוציית 1080p בלחיצה אחת.
לדברי המדען הראשי ב-Shengshu, Zhu Jun,
“הוא בעל דמיון, יכול לדמות את העולם הפיזי, ומפיק סרטונים של 16 שניות עם דמויות, סצנות וציר זמן עקביים.”
תבדקו כמה דוגמאות מסרטון ההדגמה למטה.
עם זאת, אני לא יכול להיות בטוח ב-100% שהדוגמאות בסרטון ההדגמה באמת נוצרו על ידי Vidu, ולא טופלו בשום צורה.
מודל ה-Vidu AI בנוי על ארכיטקטורת מודל טרנספורמציה ויזואלית קניינית בשם Universal Vision Transformer (U-ViT), המשלבת שני מודלים של טקסט לווידאו בינה מלאכותית: ה-Diffusion וה-Transformer.
ארכיטקטורה זו מאפשרת יצירת סרטונים טובים באמת עם תנועות מצלמה דינמיות, הבעות פנים מורכבות ואפקטים של תאורה וצל אותנטיים.
האם זה יותר טוב מ-Sora?
זה מצחיק כי סרטון ההדגמה כולל קליפים שדומים לכמה מסרטוני ההדגמה של OpenAI עבור Sora. תסתכלו על הדוגמה זה לצד זה למטה:
איזה יותר טוב? למען האמת, אני אוהב את שניהם. אבל הגוונים הרכים והחמים יותר של הסרטון שנוצר על ידי Vidu גורמים לו להיראות ריאליסטי וטבעי יותר.
כמו כן, ראוי לציין ש- Sora יכולה ליצור סרטונים של עד 60 שניות, בעוד ש-Vidu נכון לעכשיו יכולה לרנדר סרטונים רק עד 16 שניות.
איך מקבלים גישה
Vidu אינו זמין ברגע זה לקהל הרחב. עם זאת, הם פתחו טופס עם רשימת המתנה כדי לקבל גישה מוקדמת:
- גשו אל www.shengshu-ai.com
- ליחצו על הכפתור הכחול בפינה השמאלית העליונה של העמוד
- מלאו את הטופס כדי לבקש גישה
הם גם מתכננים לשלב את יכולת יצירת הווידאו בכלי AI אחר בשם PixWeaver.
מה דעתי הסופית?
סרטוני ההדגמה מבית Vidu נראים סופר מרשימים, אבל כדאי לקחת אותם עם בערבון מוגבל, לפחות עד שנוכל לבדוק את האיכות האמיתית של הסרטונים בעצמנו.
העובדה שסין מותחת שרירים עם Vidu היא עניין גדול, כי זה מראה שיש להם את הטכנולוגיה והמשאבים להתחרות עם הטובים בעולם בכל הקשור לבינה מלאכותית. אני רק יכול לחכות להתנסות בעצמי עם Vidu ולראות איך זה מתמודד מול Sora.