نسخه سوم مدلهای تولید ویدیو با هوش مصنوعی، Veo 3، یکی از بهترین مدلهای موجود است، اگر نگوییم بهترین. با این حال، بسیاری از کاربران منتظر جایگزین آن، یعنی هوش مصنوعی Veo 4 هستند، مدلی که قرار است مشکلات گذشته را برطرف کرده و امکان خلق صحنههای پیچیده و واقعگرایانهتر با هوش مصنوعی را فراهم کند.
مدلهای تولید ویدیو Veo چیستند؟
Veo خانوادهای از مدلهای تولید ویدیو با هوش مصنوعی است که توسط Google DeepMind توسعه یافته است. این سری شامل موارد زیر است:
-
Veo (معرفی شده در می 2024)
-
Veo 2 (منتشر شده در دسامبر 2024)
-
Veo 3 (منتشر شده در می 2025)
گوگل این مدلها را برای رقابت با Sora از OpenAI و Gen-3 از Runway توسعه داده است. این مدلها قادر به تولید ویدیو از متن یا تصویر هستند و طول خروجیها بسته به نسخه، بین 4 تا 8 ثانیه متغیر است.
مدلها از طریق پلتفرمهایی مانند Overchat AI Video Generator، Google VideoFX، AI Test Kitchen و APIهای شخص ثالث مثل fal.ai در دسترس هستند. هر نسخه با بهبود کیفیت ویدیو، ثبات و سرعت تولید همراه بوده است.
آخرین مدل Veo: Veo 3
Veo 3 در می 2025 عرضه شد و یک پیشرفت بزرگ در تولید ویدیو با هوش مصنوعی ایجاد کرد. این مدل اولین مدلی بود که همزمان صدا و تصویر را تولید میکرد، شامل دیالوگ، افکتهای صوتی و صداهای محیطی که با محتوای بصری همخوانی داشتند.
وقتی اولین بار منتشر شد، بهترین مدل برای فیزیک، نورپردازی و انیمیشن بود، اما بعدها توسط Sora 2 از OpenAI پشت سر گذاشته شد.
مشخصات فنی Veo 3:
-
خروجی 1080p
-
ویدیوهای 8 ثانیهای
-
نسبت تصویر 16:9 (افقی) و 9:16 (عمودی)
-
تولید صدا به صورت همزمان با هماهنگی لبها
نسخههای Veo 3:
-
Standard Veo 3: کیفیت حداکثری
-
Veo 3 Fast: بهینهشده برای سرعت
Veo 3 در دنبال کردن دستورالعملهای مربوط به زاویه دوربین، حرکت و ترکیب صحنه بسیار خوب است و مفاهیم پیچیدهای مانند “دالی زوم” یا “شات دنبالکننده” را به خوبی اجرا میکند. نسخه Fast سریعتر و ارزانتر است، اما کیفیت کمتری دارد.
زمان انتشار هوش مصنوعی Veo 4
-
Veo 2 در دسامبر 2024 منتشر شد و Veo 3 پنج ماه بعد در می 2025 عرضه شد.
-
اگر گوگل همین روند را ادامه دهد، Veo 4 احتمالاً در اکتبر یا نوامبر 2025 عرضه خواهد شد، ولی ممکن است تا دسامبر صبر کنند تا زمانبندی مشابه Veo 2 داشته باشد.
-
گزینه دیگر، Google I/O در می 2026 است، جایی که گوگل معمولاً محصولات مهم هوش مصنوعی خود را معرفی میکند.
با توجه به رقابت با Sora 2، دسامبر 2025 پیشبینی واقعبینانهتری است، چرا که گوگل فرصت کافی برای ارائه یک جهش بزرگ برای رقابت دارد.
قابلیتهای مورد انتظار Veo 4
انتظار میرود Veo 4 با ویژگیهای زیر عرضه شود:
-
ویدیوهای طولانیتر از 8 ثانیه (احتمالاً 15 تا 30 ثانیه)
-
امکان وارد کردن خود به صحنهها با آواتار
-
ثبات بهتر در صحنهها
-
درک بهتر متن و دستورالعملها
-
تولید صحنه از چند زاویه همزمان
-
ویرایش ویدیو در زمان واقعی
جزئیات قابلیتها:
-
ویدیوهای طولانیتر:
Veo 4 احتمالاً طول ویدیوها را به 15-30 ثانیه افزایش میدهد و حتی از Sora 2 پیشی میگیرد. -
آواتار شخصی:
کاربران میتوانند عکس و صدای خود را آپلود کرده و ویدیوهای شخصیسازی شده بسازند. آواتار حرکت طبیعی خواهد داشت و هماهنگی کامل با نور و صحنه خواهد داشت. -
ثبات بهتر صحنهها:
Veo 4 میتواند تغییرات غیرمنتظره در لباس یا موقعیت اشیاء را از بین ببرد و تمامی فریمها را با ثبات کامل تولید کند. -
بهبود درک دستورالعملها:
Veo 4 هر دستور شما را با دقت بیشتری دنبال میکند و احتمال خطاهای Veo 3 را کاهش میدهد. -
تولید صحنه از چند زاویه:
میتوان یک صحنه را از چند زاویه مختلف همزمان تولید کرد؛ چیزی که در حال حاضر توسط رقبا انجام نمیشود. -
ویرایش ویدیو در زمان واقعی:
امکان ویرایش در حین تولید ویدیو، ویژگی انقلابی Veo 4 خواهد بود و هزینهها و زمان تولید را کاهش میدهد.
دسترسی به Veo 4
احتمالاً Veo 4 در همان پلتفرمهای Veo 3 در دسترس خواهد بود:
-
Overchat AI: ارائه بهترین قیمتها
-
Google VideoFX: پلتفرم رسمی گوگل با تمامی ویژگیها
-
AI Test Kitchen: دسترسی زودهنگام و ویژگیهای بتا
برخی معتقدند گوگل ممکن است Veo 4 را به Workspace نیز اضافه کند تا تولید ویدیو مستقیماً در Google Slides یا Docs امکانپذیر شود، ولی این احتمال کمتر است، چرا که هزینه تولید ویدیو بالا است.
هزینه Veo 4
با توجه به قیمتهای Veo 3:
-
Veo 3 حدود 23 دلار برای هر دقیقه ویدیو 8 ثانیهای در fal.ai هزینه دارد.
سیستم قیمتگذاری احتمالی Veo 4:
-
رایگان: 1–3 ویدیو با نسخه Fast
-
Basic: 20-30 دلار در ماه
-
Pro: 100-150 دلار در ماه برای 500 ویدیو
-
Enterprise: قیمت سفارشی برای تولید نامحدود
با طولانیتر شدن ویدیوها، هزینهها افزایش خواهد یافت، اما رقابت با Sora 2 ممکن است قیمتها را کاهش دهد. همچنین، دسترسی به Veo 4 در Overchat AI ممکن است با تنها 4.99 دلار در هفته ممکن شود.
نتیجهگیری
Veo، خانوادهای از مدلهای تولید ویدیو با هوش مصنوعی گوگل است که متن و تصویر را به ویدیو همراه با صدا تبدیل میکند.
-
Veo: می 2024
-
Veo 2: دسامبر 2024
-
Veo 3: می 2025
انتظار میرود Veo 4 در دسامبر 2025 یا می 2026 منتشر شود و ویژگیهای جدیدی مانند ویدیوهای طولانیتر، ثبات بهتر، تولید چند زاویهای و ویرایش در زمان واقعی را ارائه دهد، که میتواند تحول بزرگی در تولید ویدیو با هوش مصنوعی ایجاد کند.
نظرات کاربران