«میدجرنی» یک برنامه هوش مصنوعی ساخته شده است که رقبای بسیار دارد. اگر شما با این برنامه کار کنید، ویژگی ها و مواد غذایی آن آشنا شوید، این گزارش را مطالعه می کنید.
به گزارش ایسنا و به نقل از اندروید اتوریتی، به لطف برنامههای هوش مصنوعی شبیه «میدجرنی»(Midjourney) در حال حاضر میتوانید در چند دقیقه مستقیم از تصاویر خود تداعی کنید. مهم نیست که مهارتهای هنری هنری یا در زندگی خود حتی یک قلممو به دست نگرفتهاید زیرا این هنر مصنوعی میتواند هنر را در چند دهه ایجاد کند. تنها چیزی که نیاز دارید، کمی متن است تا تصویر نقشبسته در ذهن شما را توصیف کند.
این گزارش به نکاتی میپردازد که باید در مورد هوش مصنوعی میدجرنی بدانید.
میدجرنی چیست؟
میدجرنی یک نمونه از مصنوعی مصنوعی است که میتواند گفتههای زبان طبیعی را به تصاویر تبدیل کند. این تنها یکی از انواع متعدد مولدهای تصویر بر ماشینی است که اخیراً ظهور کرده است. به رغم وجود داشتن مدلهای ماشینی مانند «دال-ئی» (DALL-E) شرکت «OpenAI» و «استیبل دیفیوژن» (Stable Diffusion) متعلق به «استبیلیتی ایآی» (Stability AI)، میدجرنی به یکی از بزرگترین نامهای هوش مصنوعی تبدیل شده است.
با میدجرنی میتوانید تصاویر با کیفیت بالا را از اعلانهای ساده بر متن ایجاد کنید. برای استفاده از میدجرنی، به سختافزار یا نرمافزار تخصصی نیاز به این برنامه کاملاً از طریق اپلیکیشن چت «دیسکورد»(Discord) کار میکند. تنها نقطه ضعف میدجرنی است که پیش از شروع تولید تصاویر باید کمی هزینه بپردازید. این مرحله روند کاری بیشتر از رقبا است که معمولاً حداقل چند تصویر را به صورت رایگان ارائه میدهند.
میدجرنی میتواند تصاویر خیرهکنندههای را از یک توضیح متنی ساده ایجاد کند.با وجود این، ورود به میدجرنی بسیار کم است و هر کسی میتواند از آن برای تولید تصاویر واقعی در چند دقیقه استفاده کند. بسته به درخواست کاربر، نتایج میتوانند غیرعادی یا خیرهکننده باشند.
در برخی موارد، تصاویر میدجرنی حتی عکاسی و سایر حوزه ها را فریب داده اند. بنابراین، ممکن است تصاویر بسیار قانعکنندهای را که توسط هوش مصنوعی میدجرنی در رسانههای اجتماعی دیده میشود، تولید کنند.
نمونههایی از این تصاویر، «پاپ فرانسیس» (پاپ فرانسیس) پوشیده شده در کاپشن پفدار یا «دونالد ترامپ» (دونالد ترامپ) دستگیر شده پیش از رویدادهای واقعی هستند. برخی از این تصاویر، صحنههای خلاقانهای مانند صحنههای فیلم «جنگ ستارگان» (جنگ ستارگان) را به نمایش میگذارند.
شرکت OpenAI خالق چتبات «ChatGPT» از میشود، میدجرنی خود را به عنوان یک پروژه مستقل و با سرمایه خود معرفی میکند. علاوه بر این، میدجرنی تا به امروز هیچ بودجهای را از بیرون دریافت نکرده است. در مقابل، OpenAI بالغ بر 10 دلار از شرکت «مایکروسافت» (مایکروسافت) و سرمایهگذاران جمعآوری شده است. بنابراین، با توجه به این موضوعات، نتایج میدجرنی کاملا چشمگیر هستند.
میدجرنی چطور کار می کند؟
ما همه چیز را در عملکرد داخلی میدجرنی نمیدانیم زیرا این یک برنامه منبع بسته است و با کد اختصاصی اجرا میشود. با وجود این، ما به اندازه کافی در فناوری زیربنای آن میدانیم تا یک توضیح کلی را ارائه دهیم.
میدجرنی بر دو فناوری نسبتا جدید ماشینی، یعنی مدلهای زبانی بزرگ و مدلهای انتشاری متکی است. اگر از چتباتهای مصنوعی مانند ChatGPT استفاده کردهاید، ممکن است با حالت اول آشنا باشید. ابتدا یک مدل زبانی بزرگ به میدجرنی کمک می کند تا معنای کلمات را که شما در دستورات خود تایپ کرده اید، درک کنید. سپس، این به یک گرافیک برداری تبدیل می شود که می توانید آن را به عنوان یک نسخه از دستور خود بسازید. در نهایت، این گرافیک به هدایت فرآیندهای دیگری به نام انتشار کمک میکند.
میدجرنی از یک مدل انتشاری برای تبدیل نویز تصادفی به هنر زیبا استفاده میکند.مدل انتشاری که فقط در حدود یک دهه گذشته است، تولیدکنندگان تصویری مصنوعی را توضیح میدهند. در یک مدل انتشاری، شما یک رایانه دارید که نویز تصادفی را به مجموعه آموزشی خود اضافه می کند. با گذشت زمان، رایانه یاد میبرد که چگونه با معکوس کردن نویز، تصویر اصلی را به دست بیاورد. ایده این است که چنین مدلی با آموزش کافی میتوان یاد کرد چگونه تصاویر کاملا جدید را تولید کند.
بنابراین، باید دید که این از منظر یک هوش مصنوعی مولد چگونه به نظر میرسد. وقتی یک پیام متنی را به برنامه وارد میکنید، کار آن با میدانی از نویز بصری آغاز میشود. میتوانید گام اول را معادل تلویزیون ثابت در نظر بگیرید. تصویر در این مرحله به چیزی نیست که شما بخواهید. سپس یک مدل هوش مصنوعی آموزشدیده، از مدل انتشاری پنهان برای کم کردن نویز در مراحل استفاده میکند. در نهایت، تصویری شبیه به اشیاء و ایدهها در دنیای واقعی به دست میآید.
به همین دلیل است که باید یک یا دو دقیقه منتظر بمانید تا تصویر تولید شده توسط هوش مصنوعی کامل شود. اگر این روند را زودتر انجام دهید، یک تصویر از نویز را میبینید که مراحل حذف نویز را به اندازه کافی انجام دهید.
هزینه میدجرنی چقدر است؟
پیشتر شاهد بودیم که چتباتهایی مانند ChatGPT و «بینگ چت» (Bing Chat)، استفاده از نامحدود را به صورت رایگان ارائه میدهند اما این موضوع در تولیدکنندگان تصویر صدق نمیکند. مشخصه همه آنها دارای و میدجرنی هستند حتی یک آزمایش رایگان ارائه نمیدهد. دلیل این است که تصویر به قدرت محاسباتی و به ویژه «واحدهای پردازش گرافیکی» (GPU) نیاز زیادی دارد. علاوه بر این، هر پردازنده گرافیکی دارای حافظه ویدئویی محدود است که مقدار زیادی از آن برای حذف نویز استفاده میشود. بنابراین با در نظر گرفتن این موضوع، جای تعجب نیست که یک هوش مصنوعی مولد تصویر پیشرفته، مقداری هزینه برای کاربر داشته باشد.
میدجرنی ۱۰ دلار در ماه هزینه دارد اما در برنامههای سطح بالاتر میکند.یک راهنمای اختصاصی در سطح قیمتگذاری و اکانت اشتراک میدجرنی وجود دارد اما کاربران باید ماهانه حداقل ۱۰ دلار به صورت ثابت بپردازند. این مبلغ، 3.3 ساعت زمان پردازش گرافیکی را میکند که برای 200 تصویر خوب است. گرانترین طرح، ۶۰ ساعت زمان پردازش گرافیکی سریع را با ۱۲۰ دلار در ماه ارائه میکند.
برنامههای پیشرفته میدجرنی، تصاویر نامحدود را در «حالت آرام» (حالت آرام) به شما میدهد اما باید تا ۱۰ دقیقه صبر کنید. اگر به بهترین کیفیت نیاز، توصیه میشود جایگزینهای متعدد میدجرنی شود. تقریباً همه شرکتهای فناوری، از «گوگل» گرفته شده تا «متا» اکنون دارای مولدهای تصویر رقیب هستند که بسیاری از آنها یک سکه هم ندارند.
انتهای پیام