Stability AI، توسعهدهنده Stable Diffusion، در حال پیشنمایش هوش مصنوعی مولد جدیدی است که میتواند ویدیوهای کوتاهمدت را با یک پیام متنی ایجاد کند.
به درستی نامیده می شود انتشار ویدئوی پایدار، از دو مدل هوش مصنوعی (معروف به SVD و SVD-XT) تشکیل شده است و قادر به ایجاد کلیپ با وضوح 576 در 1024 پیکسل است. کاربران میتوانند سرعت فریم را طوری تنظیم کنند که بین سه تا 30 فریم بر ثانیه اجرا شود. طول فیلم ها بستگی به این دارد که کدام یک از مدل های دوقلو انتخاب شود. اگر SVD را انتخاب کنید، محتوا برای 14 فریم پخش می شود در حالی که SVD-XT آن را کمی تا 25 فریم افزایش می دهد. بر اساس لیست رسمی در Hugging Face.
این شرکت ویدئویی را در کانال یوتیوب خود منتشر کرد که نشان می داد Stable Video Diffusion چه توانایی هایی دارد و محتوای آن به طرز شگفت انگیزی با کیفیت بالا است. مطمئناً آنها سوخت کابوسهایی نیستند که در سایر هوش مصنوعی میبینید ساخت ویدیو متا. به نظر ما چشمگیرترین آنها باید نسخه نمایشی Ice Dragon باشد. شما می توانید جزئیات زیادی را در ترازوهای اژدها مشاهده کنید به علاوه کوه هایی که در پشت هستند شبیه چیزی خارج از یک نقاشی هستند. همانطور که می توانید تصور کنید انیمیشن بسیار محدود است زیرا سوژه فقط می تواند به آرامی سر خود را تکان دهد. همین امر را می توان در دموهای دیگر مشاهده کرد. این یا یک چرخه راه رفتن سفت است یا یک عکس متحرک آهسته.
در مراحل اولیه
محدودیت ها به همین جا ختم نمی شود. Stable Video Diffusion طبق گزارشها نمیتواند «فورئالیسم کاملی را به دست آورد»، نمیتواند «متن خوانا» تولید کند، بعلاوه با چهرهها کار سختی دارد. نمایش دیگری در وبسایت Stability AI نشان میدهد که مدل آن میتواند چهره یک مرد را بدون هیچ نقص عجیبی به تصویر بکشد، بنابراین میتواند به صورت موردی باشد.
به خاطر داشته باشید که این پروژه هنوز در مراحل اولیه است. واضح است که این مدل برای عرضه گسترده آماده نیست و هیچ برنامه ای برای انجام این کار وجود ندارد. هوش مصنوعی پایداری تأکید میکند که Stable Video Diffusion در حال حاضر «برای برنامههای کاربردی در دنیای واقعی یا تجاری» نیست. در واقع، در حال حاضر “فقط برای اهداف تحقیقاتی در نظر گرفته شده است.” ما تعجب نمی کنیم که توسعه دهنده با فناوری خود بسیار محتاط عمل کند. سال گذشته اتفاقی افتاد که مدل Stability Diffusion به صورت آنلاین به بیرون درز کرد، منجر به استفاده بازیگران بد برای ایجاد تصاویر جعلی عمیق می شود.
دسترسی
اگر علاقه مند به آزمایش Stable Video Diffusion هستید، می توانید با پر کردن یک لیست انتظار وارد شوید فرم در وب سایت شرکت. مشخص نیست چه زمانی افراد مجاز به ورود خواهند بود، اما پیشنمایش شامل یک رابط Text-to-Video خواهد بود. در ضمن، شما می توانید بررسی کنید کاغذ سفید هوش مصنوعی و همه چیزهای ناخوشایند پشت پروژه را بخوانید.
یکی از چیزهایی که پس از کندوکاو در سند به آن جالب توجه شد، استفاده از «مجموعه دادههای ویدیویی در دسترس عموم» به عنوان برخی از مواد آموزشی است. باز هم، با توجه به آن، شنیدن این موضوع تعجب آور نیست Getty Images از Stability AI شکایت کرد در مورد اتهامات مربوط به جمع آوری داده ها در اوایل سال جاری. به نظر می رسد که تیم تلاش می کند بیشتر مراقب باشد تا دیگر دشمنی پیدا نکند.
اطلاعاتی در مورد زمان راه اندازی Stable Video Diffusion وجود ندارد. خوشبختانه گزینه های دیگری نیز وجود دارد. حتماً فهرست TechRadar از بهترین سازندگان ویدیوهای هوش مصنوعی برای سال 2023 را بررسی کنید.