بهترین تولیدکنندههای تصویر مبتنی بر هوش مصنوعی اخیراً در خبرها بودهاند، اما نه همیشه به دلایل درست – با هوش مصنوعی Grok-2 ایلان ماسک که باعث ایجاد انواع جنجالها به دلیل عدم وجود موانع محافظ میشود. شاید گوگل بخواهد گفتگو را به سمت مثبت تری تغییر دهد، زیرا این شرکت به تازگی دسترسی به ژنراتور Imagen 3 خود را برای همه در ایالات متحده گسترش داده است و تعداد افرادی که می توانند از ابزار هوش مصنوعی استفاده کنند به طور چشمگیری افزایش می دهد.
جستجوی همراه گوگل، Imagen 3 را به عنوان “یک مدل انتشار پنهان که تصاویر با کیفیت بالا را از پیام های متنی تولید می کند” توصیف می کند، و مقاله اضافه می کند که “Imagen 3 در زمان ارزیابی بر دیگر مدل های پیشرفته ترجیح داده می شود. ” می توان از آن برای ایجاد تصاویر بر اساس متن وارد شده توسط کاربر، با برخی محدودیت ها در محتوای توهین آمیز یا غیرقانونی استفاده کرد که آن را با جایگزین های محبوب مانند Midjourney رقابت می کند.
این ابزار ابتدا در ماه می 2024 در رویداد Google I/O راه اندازی شد، اما در آن زمان محدود به کاربران Google Vertex AI بود. اکنون، هر کسی در ایالات متحده میتواند در صورت تمایل آن را امتحان کند، و این نشان میدهد که گوگل به توانایی ابزار خود برای ایجاد تصاویر قابل اعتماد و اجتناب از برخی مشکلاتی که مدتهاست با تولیدکنندگان تصویر هوش مصنوعی مواجه بوده است، مطمئنتر شده است.
تاکنون، به نظر می رسد واکنش ها به Imagen 3 متفاوت بوده است. بسیاری از کاربران متوجه شدهاند که به نظر میرسد این برنامه نسبت به قبل نسبت به درخواستهای کاربر حساستر است و کلماتی را که ممکن است در Imagen 2 مسدود نشده باشند مسدود میکند.
به عنوان مثال، یکی از کاربران در Reddit گفت: “من باید مایل بیشتری را طی کنم تا آنچه را که قبلا می گرفتم به دست بیاورم، و یک کلمه تصادفی مانند “جوراب” یا “آب” فیلتر سانسوری را ایجاد می کند که به کلمات بی ضرر حساس تر است.” برای دیگری، Imagen 3 از ترسیم ایده های به ظاهر بی گناه مانند ربات یا مردی که دستانش را روی هم می زند، خودداری کرد. با این حال، نکات مثبتی وجود دارد که یکی از کاربران در بالا به کیفیت تولید آن و “بافت و تشخیص کلمات شگفت انگیز” اشاره کرده است.
چگونه Imagen 3 را امتحان کنیم
اگر میخواهید Imagen 3 را امتحان کنید، ابتدا باید در ایالات متحده باشید تا دسترسی داشته باشید. اگر در ایالات متحده هستید، می توانید به وب سایت AI Test Kitchen گوگل بروید و با حساب Google خود وارد شوید. پس از انجام این کار، باید بتوانید از فرم ایجاد تصویر جدید خود استفاده کنید.
گزارشهای کاربران مبنی بر اینکه Imagen 3 محدودتر از نسخه قبلی خود است، نمونه مفیدی از وضعیت فعلی تولیدکنندگان تصویر هوش مصنوعی است. این ابزارها در ماههای اخیر جنجالهای زیادی را ایجاد کردهاند، و گاهی اوقات به نظر میرسد هفتهای نمیگذرد که برخی از تصاویر تولید شده توسط هوش مصنوعی احساسات اینترنت را تحریک نکند.
آخرین مقصر نرم افزار Grok-2 AI ایلان ماسک است. این ابزار – که محدود به کاربران ممتاز X (توئیتر سابق) است – اخیراً به نسخه دوم خود بهروزرسانی شده است و تصاویر را با استفاده از نرمافزار متن باز Flux تولید میکند. کاربران دریافتهاند که این ابزار محدودیتهای بسیار کمی را در مورد آنچه که میتوان ایجاد کرد اعمال میکند، و باعث میشود مردم تصاویری از دونالد ترامپ و کامالا هریس را در حال پرواز با هواپیما در 11 سپتامبر ترسیم کنند، یا تصاویری به وضوح دارای حق چاپ بدون هیچ مقاومتی از Grok ایجاد کنند.
به نظر می رسد گوگل در حال حاضر Imagen 3 را به دلیل چشم انداز محدود کننده اش در ایجاد تصویر در پس زمینه قرار داده است. اینکه آیا این با بهینه سازی و بهبود مدل تغییر خواهد کرد یا خیر، باید دید، اما با توجه به اینکه افراد بیشتری می توانند به آن دسترسی داشته باشند، احتمالاً نیازی نیست مدت زیادی منتظر بمانیم تا ببینیم تا چه حد می توان محدودیت های آن را پشت سر گذاشت.