ابزار جدید Sora مولد OpenAI در هفته گذشته بحثهای پر جنب و جوش فناوری را برانگیخت و باعث ایجاد شور و شوق و نگرانی در بین طرفداران و منتقدان شد.
Sora یک مدل تبدیل متن به ویدیو است که به طور قابل توجهی ادغام یادگیری عمیق، پردازش زبان طبیعی و بینایی رایانه ای را برای تبدیل پیام های متنی به محتوای ویدیویی دقیق و منسجم مانند زندگی پیش می برد.
برخلاف فناوریهای قبلی متن به ویدیو، مانند Make-A-Video متا، Sora میتواند بر محدودیتهای مربوط به نوع دادههای بصری که میتواند تفسیر کند، طول ویدیو و وضوح تصویر غلبه کند.
از آنچه OpenAI نشان داده است، Sora میتواند ویدیوهایی با طولهای مختلف، از کلیپهای کوتاه گرفته تا روایتهای تمام دقیقه، و با کیفیت بالا، با طیف وسیعی از نیازهای خلاق تولید کند.
اگرچه تاریخ انتشار رسمی اعلام نشده است، اما با قضاوت بر اساس الگوی معمولی OpenAI از انتشار عمومی، Sora احتمالا در ماه های آینده در دسترس عموم قرار خواهد گرفت. در حال حاضر، فقط در اختیار کارشناسان و چند هنرمند و فیلمساز است.
سورا چگونه کار می کند
در قلب نوآوری سورا، تکنیکی است که داده های بصری را به قالبی تبدیل می کند که به راحتی قابل درک و دستکاری است، شبیه به نحوه شکسته شدن کلمات به نشانه هایی برای پردازش هوش مصنوعی توسط برنامه های کاربردی مبتنی بر متن.
این فرآیند شامل فشردهسازی دادههای ویدیویی به شکلی قابل مدیریتتر و تقسیم آن به تکهها یا بخشها است. این بخشها مانند بلوکهای ساختمانی عمل میکنند که Sora میتواند آنها را برای ایجاد ویدیوهای جدید مرتب کند.
سورا از ترکیبی از یادگیری عمیق، پردازش زبان طبیعی و بینایی کامپیوتری برای دستیابی به قابلیت های خود استفاده می کند.
یادگیری عمیق به درک و تولید الگوهای پیچیده در دادهها کمک میکند، پردازش زبان طبیعی اعلانهای متنی را برای ایجاد ویدیو تفسیر میکند، و بینایی رایانه به آن اجازه میدهد تا محتوای بصری را با دقت درک کرده و تولید کند.
با استفاده از یک مدل انتشار – نوعی مدل که به ویژه در تولید تصاویر و ویدیوهای با کیفیت بالا خوب است – Sora میتواند دادههای پر سر و صدا و ناقص را بگیرد و آن را به محتوای ویدیویی واضح و منسجم تبدیل کند.
رویکرد سورا با ایجاد یک کاراکتر CGI، که نیازمند تلاش دستی گسترده است، و با فناوریهای دیپفیک سنتی، که اغلب فاقد ضمانتهای اخلاقی هستند، با ارائه روشی مقیاسپذیر و قابل انطباق برای تولید محتوای ویدیویی بر اساس ورودی متن متفاوت است.
این برای کسب و کارها چه معنایی دارد؟
یکی از قابل توجه ترین جنبه های Sora انعطاف پذیری آن است، زیرا از فرمت ها و اندازه های مختلف ویدیو پشتیبانی می کند، کادربندی و ترکیب بندی را برای یک پایان حرفه ای بهبود می بخشد، و متن، تصاویر یا فیلم ها را به عنوان درخواست برای متحرک کردن تصاویر یا گسترش ویدیوها می پذیرد.
ظهور Sora فرصت های کلیدی را برای مشاغل در بخش های مختلف ارائه می دهد. در آینده نزدیک، دو حوزه کلیدی وجود دارد که ممکن است کاربردهای قابل توجهی داشته باشند.
حوزه اول در بازاریابی و تبلیغات است. همانطور که ChatGPT به یک ابزار بازاریابی و تولید محتوا تبدیل شده است، می توانیم انتظار داشته باشیم که مشاغل به دلایل مشابه از Sora استفاده کنند.
با انتشار عمومی Sora، برندها و شرکت ها می توانند محتوای ویدیویی بسیار جذاب و جذاب برای کمپین های بازاریابی، رسانه های اجتماعی و تبلیغات ایجاد کنند.
توانایی تولید ویدیوهای سفارشی بر اساس پیامهای متنی به خلاقیت و شخصیسازی بیشتر اجازه میدهد و احتمالاً به برندها کمک میکند در بازار شلوغ برجسته شوند.
دومین حوزه ای که سورا می تواند تأثیر بگذارد، آموزش و آموزش است. شرکتها میتوانند از Sora برای توسعه ویدیوهای آموزشی و آموزشی که برای موضوعات یا سناریوهای خاص طراحی شدهاند، استفاده کنند. این می تواند تجربه یادگیری را برای کارمندان و مشتریان افزایش دهد و اطلاعات پیچیده را در دسترس تر و جذاب تر کند.
بخشهای دیگر، مانند تجارت الکترونیک، پتانسیل امیدوارکنندهای برای کاربرد آتی Sora دارند. خرده فروشان می توانند نمایش های محصول پویا را ایجاد کنند که به طور موثر محصولات را به شیوه ای جذاب تر و تعاملی تر به نمایش بگذارد.
این امر به ویژه برای شرکتهایی که میخواهند جنبههای خاصی از محصولات را برجسته کنند که ممکن است به راحتی از طریق تصاویر ثابت یا متن منتقل نشود، یا برای محصولات تبلیغاتی که نیاز به توضیح دقیق دارند مفید است.
سورا همچنین میتواند با تسهیل تجربههای آزمایشی مجازی، عدم اطمینان مربوط به خرید آنلاین را به میزان قابل توجهی کاهش دهد و به مشتریان این امکان را میدهد تا تصور کنند که یک محصول، مانند لباس یا لوازم جانبی، بدون نیاز به لوازم فیزیکی چگونه به نظر میرسد. این به نوبه خود می تواند منجر به بازگشت سرمایه بهتر شود.
چالش های کلیدی پیش رو چیست؟
در حالی که فرصتهای کلیدی پیش رو وجود دارد، OpenAI، تنظیمکنندهها و کاربران باید عوامل کلیدی را که میتواند چالشهایی از جمله مسائل مربوط به حق چاپ، نگرانیهای اخلاقی و عواقب افزایش نویز دیجیتال را ایجاد کند، به دقت در نظر بگیرند.
با توانایی Sora برای تولید محتوای ویدیویی واقعی، خطر ایجاد سهواً ویدیوهایی که حق نسخهبرداری موجود را نقض میکنند، وجود دارد. OpenAI قبلاً چندین بار به دلیل نقض کپی رایت و مسائل مربوط به مالکیت معنوی شکایت کرده است.
OpenAI فاش نکرده است که داده های مورد استفاده برای آموزش سورا از کجا آمده است، اما به این موضوع گفته است نیویورک تایمز این سیستم را با استفاده از ویدیوهایی که در دسترس عموم و دارای مجوز از صاحبان حق چاپ بود، آموزش می داد.
این فناوری همچنین سوالات اخلاقی را مطرح می کند، به ویژه در مورد ایجاد ویدیوهای جعلی عمیق یا محتوای گمراه کننده.
ایجاد رهنمودها و اقدامات حفاظتی برای جلوگیری از سوء استفاده برای حفظ اعتماد به فناوری ضروری است. OpenAI در پستی در وب سایت خود اعلام کرد که در حال کار با کارشناسان برای آزمایش این مدل قبل از انتشار آن برای عموم است.
از آنجایی که مشاغل و افراد بیشتری به Sora دسترسی پیدا می کنند، امکان افزایش محتوای ویدیویی با کیفیت پایین یا نامربوط وجود دارد که منجر به افزایش “نویز دیجیتال” می شود که می تواند کاربران را تحت فشار قرار دهد. یافتن راه هایی برای فیلتر کردن و مدیریت محتوا برای کسب و کارهایی که به دنبال حفظ برتری خود هستند اهمیت فزاینده ای پیدا می کند.
آخرین، اما مطمئنا نه کم اهمیت، این سوال است که چگونه Sora بر بازار کار برای سازندگان محتوا تأثیر می گذارد. در حالی که Sora پتانسیل خودکارسازی برخی از جنبههای تولید ویدیو، مانند ChatGPT را دارد، بعید است که به این زودی جایگزین خلاقیت و بینش انسانی شود.
در عوض، Sora میتواند به عنوان ابزاری عمل کند که تواناییهای تولیدکنندگان محتوا را افزایش میدهد و به آنها اجازه میدهد تا محتوای با کیفیت بالاتر را به طور کارآمدتری تولید کنند. مانند هر پیشرفت تکنولوژیکی، کلید این است که حرفه ای ها سازگار شوند و راه هایی برای ادغام Sora در جریان کار خود بیابند و از نقاط قوت آن برای تکمیل مهارت ها و خلاقیت خود استفاده کنند.
ارائه شده توسط The Conversation
این مقاله از The Conversation تحت مجوز Creative Commons بازنشر شده است. مقاله اصلی را بخوانید.
نقل قول: ابزار مولد جدید OpenAI Sora می تواند بازاریابی و ایجاد محتوا را متحول کند (2024، 22 فوریه) در 27 فوریه 2024 از https://techxplore.com/news/2024-02-openai-generative-tool-sora-revolutionize.html بازیابی شده است.
این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.