گوگل از مدل جدید هوش مصنوعی خود با نام Veo 3.1 رونمایی کرده است. نسخهای که بر پایه Veo 3 ساخته شده و اکنون توانایی تولید ویدیوهای واقعی صدادار و قابل ویرایش را دارد. در این مدل، گوگل تلاش کرده تا تمرکز را از محتوای سطحی شبکههای اجتماعی بهسمت کاربردهای حرفهای و ویرایشی سوق دهد.
بهگفته گوگل مدل Veo 3.1 عملکرد بهتری در تبدیل تصویر به ویدیو دارد و اکنون خروجیهای صوتی و تصویری آن به شکل چشمگیری بهبود یافتهاند. این نسخه به کاربران امکان میدهد تا اشیای جدیدی را به ویدیو اضافه کرده و آنها را با سبک کلی ویدیو هماهنگ کنند.

همچنین در آینده نزدیک امکان حذف اشیاء از ویدیوها در ابزار Flow نیز فراهم میشود. تمامی قابلیتهای Veo 3 مانند افزودن تصویر مرجع برای هدایت کاراکتر، تولید ویدیو از روی فریم ابتدایی و انتهایی و همچنین گسترش ویدیو براساس فریمهای آخر در نسخه 3.1 با صدا همراه شدهاند تا ویدیوها طبیعی و زنده بهنظر بیایند.
techcrunch گزارش داده که مدل هوش مصنوعی Veo 3.1 علاوه بر بهبود در درک دستورهای متنی، حالا موتور اصلی ویرایشگر ویدیوی Flow محسوب میشود و از طریق اپلیکیشن Gemini و همچنین رابطهای برنامهنویسی Gemini و Vertex در دسترس کاربران قرار گرفته است.
گوگل اعلام کرده از زمان عرضه Flow در اردیبهشت ماه کاربران بیش از ۲۷۵ میلیون ویدیو با استفاده از این ابزار ساختهاند. براساس نمونههای منتشرشده هرچند کیفیت خروجی Veo 3.1 هنوز در برخی موارد حالت مصنوعی دارد و از واقعگرایی مدل Sora 2 شرکت OpenAI فاصله گرفته اما تصمیم گوگل برای تمرکز بر ابزارهای حرفهای و خلاقانه، گامی مثبت در مسیر تکامل تولید ویدیوهای هوش مصنوعی بهشمار میرود.
