اوایل این هفته، گوگل از مدل جدید هوش مصنوعی Gemini (AI) خود رونمایی کرد و به جرات می توان گفت که این ابزار کاملاً دنیای فناوری را شگفت زده کرد. که تا حدی به دلیل تاثیرگذار بود نسخه ی نمایشی ویدیویی “دست روی”. (در زیر) که گوگل به اشتراک گذاشته است، اما اکنون مشخص شده است که همه چیز آنطور که به نظر می رسید نبوده است.
به گزارش بلومبرگ، گوگل تعاملات با Gemini را به روش های متعددی برای ایجاد نمایش تغییر داد. این سوال در مورد تواناییهای ربات چت و همچنین اینکه چقدر گوگل توانسته به رقیب OpenAI و محصول ChatGPT خودش برسد، ایجاد میکند.
به عنوان مثال، توضیحات یوتیوب ویدیو توضیح می دهد که «برای اهداف این نسخه آزمایشی، تأخیر کاهش یافته است و خروجی های Gemini برای اختصار کوتاه شده است». به عبارت دیگر، پاسخگویی جمینی به پرسشها بسیار بیشتر از نسخه نمایشی پیشنهادی طول میکشد.
و حتی آن پرس و جوها نیز مورد بررسی قرار گرفته اند. گزارش بلومبرگ میگوید، معلوم میشود که دمو «در زمان واقعی یا به صورت صوتی انجام نشده است». در عوض، نسخه ی نمایشی واقعی از «قاب های عکس ثابت از فیلم، و درخواست از طریق متن» ساخته شد.
این بدان معناست که Gemini به درخواست های دنیای واقعی به سرعت در زمان واقعی پاسخ نمی دهد – بلکه به سادگی آنچه را که در تصاویر ثابت نشان داده می شود شناسایی می کند. به تصویر کشیدن آن به عنوان یک مکالمه روان و روان (همانطور که گوگل انجام داد) کمی گمراه کننده است.
راه طولانی در پیش است
این همش نیست. گوگل ادعا کرد که Gemini تقریباً در هر آزمایشی که این دو ابزار انجام داده اند می تواند از مدل رقیب GPT-4 پیشی بگیرد. با این حال، با نگاهی به اعداد، جمینی در بسیاری از معیارها تنها با چند درصد جلوتر است – علیرغم اینکه GPT-4 تقریباً یک سال است که عرضه شده است. این نشان میدهد که Gemini به تازگی به محصول OpenAI رسیده است و ممکن است سال آینده یا زمانی که GPT-5 در نهایت عرضه شود، اوضاع بسیار متفاوت به نظر برسد.
برای یافتن سایر نشانههای نارضایتی از Gemini Pro، که نسخهای است که در حال حاضر Google Bard را تامین میکند، چیز زیادی لازم نیست. کاربران X (توئیتر سابق) نشان داده اند که مستعد بسیاری از “توهمات” آشنای است که سایر چت بات ها تجربه کرده اند. برای مثال، یکی از کاربران جمینی را پرسید تا یک کلمه شش حرفی به زبان فرانسوی به آنها بگویم. در عوض، Gemini با اطمینان یک کلمه پنج حرفی تولید کرد که تا حدودی شایعات قبل از راه اندازی Gemini مبنی بر اینکه هوش مصنوعی گوگل با زبان های غیر انگلیسی مشکل دارد را تایید می کند.
سایر کاربران از Gemini ابراز نارضایتی کرده اند ناتوانی در ایجاد کد دقیق و آن بی میلی به خلاصه کردن موضوعات حساس خبری. حتی کارهای ساده – مانند نامگذاری جدیدترین برندگان اسکار – منجر به پاسخ های اشتباه یکپارچه شد.
همه اینها نشان می دهد که در حال حاضر، Gemini ممکن است از انتظارات عالی ایجاد شده توسط نسخه ی نمایشی نرم افزاری گوگل کوتاه بیاید، و یادآوری به موقع است که به هر چیزی که در یک ویدیوی نمایشی می بینید اعتماد نکنید. همچنین نشان میدهد که گوگل با وجود منابع عظیمی که این شرکت در اختیار دارد، هنوز راه زیادی برای رسیدن به OpenAI دارد.