«میدجرنی» متخصص تبدیل ذهنیات شما به تصویر!


«میدجرنی» یک برنامه هوش مصنوعی ساخته شده است که رقبای بسیار دارد. اگر شما با این برنامه کار کنید، ویژگی ها و مواد غذایی آن آشنا شوید، این گزارش را مطالعه می کنید.

به گزارش ایسنا و به نقل از اندروید اتوریتی، به لطف برنامه‌های هوش مصنوعی شبیه «میدجرنی»(Midjourney) در حال حاضر می‌توانید در چند دقیقه مستقیم از تصاویر خود تداعی کنید. مهم نیست که مهارت‌های هنری هنری یا در زندگی خود حتی یک قلم‌مو به دست نگرفته‌اید زیرا این هنر مصنوعی می‌تواند هنر را در چند دهه ایجاد کند. تنها چیزی که نیاز دارید، کمی متن است تا تصویر نقش‌بسته در ذهن شما را توصیف کند.

این گزارش به نکاتی می‌پردازد که باید در مورد هوش مصنوعی میدجرنی بدانید.

میدجرنی چیست؟

میدجرنی یک نمونه از مصنوعی مصنوعی است که می‌تواند گفته‌های زبان طبیعی را به تصاویر تبدیل کند. این تنها یکی از انواع متعدد مولدهای تصویر بر ماشینی است که اخیراً ظهور کرده است. به ‌رغم وجود داشتن مدل‌های ماشینی مانند «دال-ئی» (DALL-E) شرکت «OpenAI» و «استیبل دیفیوژن» (Stable Diffusion) متعلق به «استبیلیتی ای‌آی» (Stability AI)، میدجرنی به یکی از بزرگ‌ترین نام‌های هوش مصنوعی تبدیل شده است.

با میدجرنی می‌توانید تصاویر با کیفیت بالا را از اعلان‌های ساده بر متن ایجاد کنید. برای استفاده از میدجرنی، به سخت‌افزار یا نرم‌افزار تخصصی نیاز به این برنامه کاملاً از طریق اپلیکیشن چت «دیسکورد»(Discord) کار می‌کند. تنها نقطه ضعف میدجرنی است که پیش از شروع تولید تصاویر باید کمی هزینه بپردازید. این مرحله روند کاری بیشتر از رقبا است که معمولاً حداقل چند تصویر را به صورت رایگان ارائه می‌دهند.

بخوان  ویدئوی جالبی از مسابقه «دارت فضایی» در ایستگاه فضایی بین‌المللی

میدجرنی می‌تواند تصاویر خیره‌کننده‌های را از یک توضیح متنی ساده ایجاد کند.با وجود این، ورود به میدجرنی بسیار کم است و هر کسی می‌تواند از آن برای تولید تصاویر واقعی در چند دقیقه استفاده کند. بسته به درخواست کاربر، نتایج می‌توانند غیرعادی یا خیره‌کننده باشند.

در برخی موارد، تصاویر میدجرنی حتی عکاسی و سایر حوزه ها را فریب داده اند. بنابراین، ممکن است تصاویر بسیار قانع‌کننده‌ای را که توسط هوش مصنوعی میدجرنی در رسانه‌های اجتماعی دیده می‌شود، تولید کنند.

نمونه‌هایی از این تصاویر، «پاپ فرانسیس» (پاپ فرانسیس) پوشیده شده در کاپشن پف‌دار یا «دونالد ترامپ» (دونالد ترامپ) دستگیر شده پیش از رویدادهای واقعی هستند. برخی از این تصاویر، صحنه‌های خلاقانه‌ای مانند صحنه‌های فیلم «جنگ ستارگان» (جنگ ستارگان) را به نمایش می‌گذارند.

«میدجرنی» متخصص تبدیل ذهنیات شما به تصویر!

«میدجرنی» متخصص تبدیل ذهنیات شما به تصویر!

«میدجرنی» متخصص تبدیل ذهنیات شما به تصویر!

شرکت OpenAI خالق چت‌بات «ChatGPT» از می‌شود، میدجرنی خود را به عنوان یک پروژه مستقل و با سرمایه خود معرفی می‌کند. علاوه بر این، میدجرنی تا به امروز هیچ بودجه‌ای را از بیرون دریافت نکرده است. در مقابل، OpenAI بالغ بر 10 دلار از شرکت «مایکروسافت» (مایکروسافت) و سرمایه‌گذاران جمع‌آوری شده است. بنابراین، با توجه به این موضوعات، نتایج میدجرنی کاملا چشمگیر هستند.

میدجرنی چطور کار می کند؟

ما همه چیز را در عملکرد داخلی میدجرنی نمی‌دانیم زیرا این یک برنامه منبع بسته است و با کد اختصاصی اجرا می‌شود. با وجود این، ما به اندازه کافی در فناوری زیربنای آن می‌دانیم تا یک توضیح کلی را ارائه دهیم.

میدجرنی بر دو فناوری نسبتا جدید ماشینی، یعنی مدل‌های زبانی بزرگ و مدل‌های انتشاری متکی است. اگر از چت‌بات‌های مصنوعی مانند ChatGPT استفاده کرده‌اید، ممکن است با حالت اول آشنا باشید. ابتدا یک مدل زبانی بزرگ به میدجرنی کمک می کند تا معنای کلمات را که شما در دستورات خود تایپ کرده اید، درک کنید. سپس، این به یک گرافیک برداری تبدیل می شود که می توانید آن را به عنوان یک نسخه از دستور خود بسازید. در نهایت، این گرافیک به هدایت فرآیندهای دیگری به نام انتشار کمک می‌کند.

بخوان  ساخت کاتالیزور برای تصفیه آب و تولید هیدروژن

میدجرنی از یک مدل انتشاری برای تبدیل نویز تصادفی به هنر زیبا استفاده می‌کند.مدل انتشاری که فقط در حدود یک دهه گذشته است، تولیدکنندگان تصویری مصنوعی را توضیح می‌دهند. در یک مدل انتشاری، شما یک رایانه دارید که نویز تصادفی را به مجموعه آموزشی خود اضافه می کند. با گذشت زمان، رایانه یاد می‌برد که چگونه با معکوس کردن نویز، تصویر اصلی را به دست بیاورد. ایده این است که چنین مدلی با آموزش کافی می‌توان یاد کرد چگونه تصاویر کاملا جدید را تولید کند.

بنابراین، باید دید که این از منظر یک هوش مصنوعی مولد چگونه به نظر می‌رسد. وقتی یک پیام متنی را به برنامه وارد می‌کنید، کار آن با میدانی از نویز بصری آغاز می‌شود. می‌توانید گام اول را معادل تلویزیون ثابت در نظر بگیرید. تصویر در این مرحله به چیزی نیست که شما بخواهید. سپس یک مدل هوش مصنوعی آموزش‌دیده، از مدل انتشاری پنهان برای کم کردن نویز در مراحل استفاده می‌کند. در نهایت، تصویری شبیه به اشیاء و ایده‌ها در دنیای واقعی به دست می‌آید.

به همین دلیل است که باید یک یا دو دقیقه منتظر بمانید تا تصویر تولید شده توسط هوش مصنوعی کامل شود. اگر این روند را زودتر انجام دهید، یک تصویر از نویز را می‌بینید که مراحل حذف نویز را به اندازه کافی انجام دهید.

هزینه میدجرنی چقدر است؟

پیشتر شاهد بودیم که چت‌بات‌هایی مانند ChatGPT و «بینگ چت» (Bing Chat)، استفاده از نامحدود را به صورت رایگان ارائه می‌دهند اما این موضوع در تولیدکنندگان تصویر صدق نمی‌کند. مشخصه همه آنها دارای و میدجرنی هستند حتی یک آزمایش رایگان ارائه نمی‌دهد. دلیل این است که تصویر به قدرت محاسباتی و به ویژه «واحدهای پردازش گرافیکی» (GPU) نیاز زیادی دارد. علاوه بر این، هر پردازنده گرافیکی دارای حافظه ویدئویی محدود است که مقدار زیادی از آن برای حذف نویز استفاده می‌شود. بنابراین با در نظر گرفتن این موضوع، جای تعجب نیست که یک هوش مصنوعی مولد تصویر پیشرفته، مقداری هزینه برای کاربر داشته باشد.

بخوان  ارائه سرویس «۶، ۵، ۴» برای آموزش و حمایت ازکودکان و نوجوانان درفضای مجازی

میدجرنی ۱۰ دلار در ماه هزینه دارد اما در برنامه‌های سطح بالاتر می‌کند.یک راهنمای اختصاصی در سطح قیمت‌گذاری و اکانت اشتراک میدجرنی وجود دارد اما کاربران باید ماهانه حداقل ۱۰ دلار به صورت ثابت بپردازند. این مبلغ، 3.3 ساعت زمان پردازش گرافیکی را می‌کند که برای 200 تصویر خوب است. گرانترین طرح، ۶۰ ساعت زمان پردازش گرافیکی سریع را با ۱۲۰ دلار در ماه ارائه می‌کند.

برنامه‌های پیشرفته میدجرنی، تصاویر نامحدود را در «حالت آرام» (حالت آرام) به شما می‌دهد اما باید تا ۱۰ دقیقه صبر کنید. اگر به بهترین کیفیت نیاز، توصیه می‌شود جایگزین‌های متعدد میدجرنی شود. تقریباً همه شرکت‌های فناوری، از «گوگل» گرفته شده تا «متا» اکنون دارای مولدهای تصویر رقیب هستند که بسیاری از آنها یک سکه هم ندارند.

انتهای پیام



منبع