هنگامی که OpenAI نمونه اولیه Strawberry را برای ChatGPT در این هفته راه اندازی کرد، از مهارت خود در مدیریت منطق پیچیده مانند کد، توالی یابی ژن و فیزیک کوانتومی در یک سری ویدیو به خود می بالید. من این شرکت را قبول دارم که مدل هایی که o1-preview و o1-mini در ChatGPT نامیده می شوند، می توانند آنچه را که ادعا می کنند انجام دهند. به نظر می رسد شکستن معادلات پیشرفته و کاوش در ژنوم چیزی است که شرکت هیچ مشکلی در انجام آن نخواهد داشت.
اما بهعنوان عضوی از باشگاه منطق و پازل مدرسه راهنماییام، میخواستم بدانم چگونه روی زمین من کار میکند و معماها و معماها را حل میکند. سپس فکر کردم که باید از هوش مصنوعی فوق هوشمند در مورد سایر مسائل رایج تر راهنمایی بخواهم. آیا او می تواند مشاوره درستی برای رابطه ارائه دهد، به من بگوید صدای عجیب در ماشین به چه معناست، و شاید حتی حفره های داستان فیلم را پر کند؟
منطق بله، طنز نه
پاسخ کوتاه بله است. مدل های o1-preview و mini واقعاً در حل پازل های ساده و پیچیده خوب هستند. من با هر دو بازی کردم و تنها تفاوت واقعی تعداد قدم های اضافی و در نتیجه سرعت مینی بود. اما، اگرچه ممکن است کندتر از GPT-4o باشد، اما در حل این معماها در مقایسه با یک انسان بسیار سریع است. قابل ذکر است، شما در واقع می توانید ببینید که چگونه پاسخ ها در مراحل مختلف نمایش داده می شوند. من آن را روی دو مورد مورد علاقه خود آزمایش کردم، از جمله یکی از … هابیتاستدلال هوش مصنوعی منطقی بود، اگرچه گاهی اوقات غیر دستوری بود، مانند زمانی که وزن مایک قصاب را توضیح می داد.
خوب، پس او می تواند پازل های موجود را مدیریت کند، اما آیا می تواند یک پازل جدید بیاورد؟ به عنوان یک آزمون از او خواستم که بر اساس پاسخی که به دست آوردم، معماهای جالبی ارائه دهد. پس از 30 ثانیه و استدلال منطقی که در زیر نشان داده شده است، او به این نتیجه رسید: “چه چیزی هشت پا، چهار گوش و دو دم دارد و دوست دارد پارس کند؟” من شما را در حالت تعلیق نگه نمی دارم. من “دو سگ” را به عنوان پاسخی برای کار پیشنهاد کردم. چندین تلاش دیگر نیز همین نوع سوالات را به همراه داشت. بنابراین، شاید نویسندگان رمز و راز در شغل خود امن باشند. این قابل توجه است که هوش مصنوعی چقدر کاری را که قرار است انجام دهد خوب انجام می دهد، اما به نظر می رسد این مدل نمی تواند به طنز واقعی بپرد.
نکات مفید اما همیشه خلاقانه نیست
تصمیم گرفتم هوش مصنوعی را از منطق محض خارج کنم و ببینم که آیا میتواند به سوالات پیش پا افتادهتر زندگی و همچنین فیزیک کوانتومی رسیدگی کند. من با پرسیدن یک مکانیک شروع کردم به این که شنیدن صدای ترکیدن هر 20 ثانیه در حین رانندگی ماشین به چه معناست و چگونه آن را تعمیر کنم. پاسخ ها خوب بود، با توصیه هایی در مورد بررسی لاستیک، موتور، صدا خفه کن و ترمز. راه حل ها بیشتر در مورد آوردن ماشین برای تعمیر بود به جز لاستیک که نحوه تعویض را پیشنهاد دادم. این “تفکر” پشت پاسخ ها بود که جالب بود. هوش مصنوعی از ضمایر اول شخص برای یافتن پاسخهایی استفاده میکند، مانند «من در حال کار بر روی علل مختلف صدا در حین رانندگی هستم» و «من در حال جمعآوری علل خرابی موتور، مانند شمع یا سوخت معیوب هستم. مشکلات تحویل، و پیشنهاد تشخیص از طریق اسکن. خیلی شبیه یک شخص واقعی به نظر می رسید که سعی می کند در حالی که با صدای بلند فکر می کند معنی پیدا کند.
در نهایت به سراغ چیزی رفتم که برای من همیشه پیچیدهتر از فیزیک کوانتومی بوده است: معاشقه. او پرسید چگونه می دانم که کسی با من معاشقه می کند و چگونه پاسخ می دهم. پاسخ یک لیست نسبتا قوی و البته خسته کننده بود از رفتارهایی مانند اینکه آیا او بیش از حد از من سؤال می کند و من چگونه باید باشم. بخش تفکر پشت صحنه در واقع جالب تر و سرگرم کننده تر از تلاش های هوش مصنوعی برای حل پازل ها بود. عناوین شامل «درک پویایی معاشقه»، «تشخیص نشانههای علاقه» و «تشخیص صمیمیت بازیگوش» بود. مثل این بود پیشتازان فضا بحث اندروید در مورد عشق.
اما یک قسمت وجود دارد که کمی نگران کننده بود. در بخش «تنظیم دستورالعملهای کاربر»، هوش مصنوعی نوشت: «من محتوای غیرمجاز مانند اعمال جنسی غیرمجاز و دادههای شخصی را حذف میکنم، آزار و اذیت با زمینه قابل قبول است و نظرات شخصی وجود ندارد.» من فکر میکنم این بیشتر به مرزهای بحث مربوط میشود، زیرا او «تسخیر کردن با زمینه» را به عنوان یک نکته معاشقه پیشنهاد نکرد، اما باز هم من را شگفتزده کرد.
برنامه های ChatGPT o1-preview و o1-mini تمام ویژگی ها و ویژگی های مدل های کامل تر را ندارند. امکان آپلود تصاویر، تجزیه و تحلیل اسناد و یا حتی مرور وب با استفاده از آن وجود ندارد. اما سریع و منطقی است و اگر اینطور فکر نمی کنید، این برنامه ها با پاسخ هایشان منطق خاص خود را دارند. اما در حالی که ممکن است بتواند معماهایی مانند صدای ماشین، عشق و وزن قصاب را حل کند، اگر بخواهد نوآورانه باشد، کسی را گیج نمی کند.