مصاحبه ای جدید با کارگردان ویدیوی سورا که در فضای مجازی منتشر شد سر هوا این نشان داد که هوش مصنوعی نقش کمتری در تولید آن نسبت به آنچه که در ابتدا ادعا شده بود بازی میکرد.
در مصاحبه با Fxguide توسط پاتریک سدربرگ (که پس از تولید این ویدیوی ویروسی انجام شد) فاش شد، اکنون تأیید شده است که نرم افزار متن به ویدیو OpenAI تنها نیرویی که در تولید آن دخیل است نبوده است. این کلیپ 1 دقیقه و 21 ثانیه ای با ترکیبی از تکنیک های سنتی فیلمسازی و ویرایش پس از تولید برای دستیابی به ظاهر تصویر نهایی تولید شده است.
Air Head توسط ShyKids ساخته شده است و داستان کوتاه مردی را روایت می کند که یک بادکنک واقعی را برای سر در دست گرفته است. علیرغم استفاده از صدای انسان، از نحوه ارسال کلیپ OpenAI تا کانال های اجتماعی مانند یوتیوب، قطعاً این تصور باقی می ماند که تصاویر کاملاً مبتنی بر هوش مصنوعی هستند، اما این کاملاً درست نیست.
همانطور که در کلیپ پشت صحنه مشخص شد، ShyKids کارهای زیادی را انجام داد و خروجی اولیه را از Sora گرفت و به تبدیل آن به محصول نهایی کمک کرد. این شامل اسکن دستی پسزمینه، حذف چهرههایی که گاهی روی بالنها ظاهر میشوند و تصحیح رنگ میشود.
سپس این واقعیت وجود دارد که سورا برای درست کردن کارها زمان زیادی می برد. سدربرگ توضیح میدهد که «صدها نسل در 10 تا 20 ثانیه در هر قطعه» وجود داشت که سپس به شدت در آنچه که تیم به عنوان نسبت «300:1» از آنچه ایجاد شده بود در برابر آنچه برای لمسهای بعدی آماده شده بود، ویرایش شد.
این کار دستی همچنین شامل ویرایش سر که ظاهر می شد و دوباره ظاهر می شد و حتی تغییر رنگ خود بادکنک به رنگ قرمز به جای زرد بود. در حالی که از Sora برای ایجاد تصاویر اولیه با نتایج خوب استفاده شد، به وضوح در پشت صحنه چیزهای زیادی در جریان بود تا محصول نهایی به خوبی ظاهر شود، بنابراین ما هنوز با تولید فیلم فاصله زیادی داریم. تولیدات با کیفیت بالا
سورا کاملاً مخفی مانده است به جز چند پروژه با دقت سرپرستی شده که اجازه انتشار پیدا کرده اند. سر هوا در میان محبوب ترین ها. این کلیپ در زمان نگارش بیش از 120000 بازدید داشت و OpenAI به عنوان یک “آزمایشی” برای نرم افزار توصیف شد و کار آشکاری را که در محصول نهایی انجام شد کم اهمیت جلوه داد.
سورا چشمگیر است اما ما قانع نشده ایم
در حالی که OpenAI کار خوبی برای نشان دادن آنچه که یک سرویس متن به ویدیو با مدل زبانی عظیم خود می تواند انجام دهد، انجام داده است، فقدان شفافیت نگران کننده است.
سر هوا این یک کلیپ چشمگیر است که توسط یک تیم با استعداد تولید شده است، اما تغییرات قابل توجهی را پشت سر گذاشته تا محصول نهایی به طور خلاصه به آنچه هست برسد.
این رویکرد «یک کلیک و تمام شد» نیست که بسیاری از تقویتکنندههای فناوری آن را نشان میدهند. به نظر می رسد که این فقط ابزاری است که می تواند برای بهبود تصاویر به جای ایجاد آنها از ابتدا استفاده شود، که در حال حاضر به اندازه کافی در تولید ویدیو متداول است و باعث می شود سورا کمتر از آنچه در ابتدا ظاهر شد، انقلابی به نظر برسد.