ChatGPT یک رقیب بزرگ جدید پیدا می کند زیرا Anthropic ادعا می کند که هوش مصنوعی Claude 3 آن را شکست داده است.

شرکت هوش مصنوعی Anthropic در حال پیش نمایش “خانواده” جدید خود از مدل های Claude 3 است که ادعا می کند می توانند از Gemini گوگل و ChatGPT OpenAI در چندین بنچمارک بهتر عمل کنند.

این گروه از سه AI با درجات مختلف “قابلیت” تشکیل شده است. شما Claude 3 Haiku را در پایین دارید، به دنبال آن Claude 3 Sonnet، و سپس Claude 3 Opus به عنوان سگ برتر وجود دارد. Anthropic ادعا می کند که این سه نفر به دلیل چندوجهی بودن، سطح بهبود یافته دقت، درک بهتر زمینه و سرعت، “عملکرد قدرتمند” را در سراسر صفحه ارائه می دهند. نکته قابل توجه در مورد این سه نفر این است که آنها تمایل بیشتری برای پاسخ به سؤالات سخت خواهند داشت.

آنتروپیک توضیح می‌دهد که نسخه‌های قدیمی‌تر کلود گاهی از پاسخ دادن به درخواست‌هایی که مرزهای نرده‌های ایمنی را جابجا می‌کنند، خودداری می‌کنند. اکنون، خانواده کلود 3 با پاسخ‌های خود رویکرد متفاوت‌تری خواهند داشت که به آن‌ها اجازه می‌دهد به این سوالات پیچیده پاسخ دهند.

علیرغم افزایش عملکرد همه جانبه، بیشتر اعلامیه ها بر روی Opus به عنوان بهترین در همه این زمینه ها متمرکز شده است. آن‌ها تا آنجا پیش می‌روند که می‌گویند این مدل «سطوح درک تقریباً انسانی را نشان می‌دهد… (برای) کارهای پیچیده».

هوش مصنوعی تخصصی

برای آزمایش آن، آنتروپیک Opus را از طریق ارزیابی “Needle In a Haystack” یا NIAH قرار داد تا ببیند چقدر می تواند داده ها را به خاطر بیاورد. همانطور که به نظر می رسد، بسیار خوب است زیرا هوش مصنوعی می تواند اطلاعات را با جزئیات تقریباً کامل به خاطر بسپارد. این شرکت در ادامه ادعا می کند که Opus یک کوکی کاملا هوشمند است که می تواند مسائل ریاضی را حل کند، کدهای کامپیوتری تولید کند و استدلال بهتری نسبت به GPT-4 نشان دهد.

بخوان شیائومی لپ تاپ Redmi G Pro را معرفی کرد

این فناوری خالی از خصلت نیست. حتی اگر آنتروپیک بیان می کند که هوش مصنوعی آنها دقت را بهبود بخشیده است، هنوز مشکل توهم وجود دارد. پاسخ‌هایی که مدل‌ها ارائه می‌دهند ممکن است حاوی اطلاعات اشتباه باشند، اگرچه در مقایسه با Claude 2.1 بسیار کاهش یافته‌اند. به علاوه، Opus در پاسخ به سوالی با سرعتی قابل مقایسه با کلود 2 کمی کند عمل می کند.

البته، این بدان معنا نیست که هایکو یا سونت کمتر از Opus هستند زیرا موارد استفاده خاصی دارند. به عنوان مثال، هایکو در پاسخ دادن سریع و گرفتن اطلاعات “از داده های بدون ساختار” عالی است. همچنین، در پاسخگویی به سوالات ریاضی به خوبی Opus نیست. Sonnet مدلی در مقیاس بزرگتر است که برای کمک به افراد در صرفه جویی در وقت در کارهای ساده و حتی تجزیه خطوط “متن از تصاویر” طراحی شده است، در حالی که Opus برای عملیات در مقیاس بزرگ ایده آل است.

تغییر اینترنت

هر دو Sonnet و Opus در حال حاضر برای خرید در دسترس هستند، اگرچه یک نسخه رایگان از Claude در وب سایت شرکت وجود دارد. تاریخ عرضه هایکو مشخص نشده است، اما Anthropic اعلام کرده که به زودی منتشر خواهد شد.

همانطور که احتمالاً می توانید حدس بزنید، سه گانه Claude 3 بیشتر برای مشاغلی طراحی شده است که به دنبال خودکارسازی بارهای کاری خاص هستند. تجربه شما با گروه احتمالاً در قالب یک چت بات آنلاین خواهد بود. آمازون اخیراً اعلام کرده است که هوش مصنوعی جدید Anthropic را در AWS (سرویس‌های وب آمازون) پیاده‌سازی می‌کند که به وب‌سایت‌های روی پلتفرم راهی برای ایجاد یک مدل Claude 3 سفارشی برای مطابقت با نیازهای برندها و مشتریانشان می‌دهد.

بخوان چین موفق به کاشت برنج و شاهی در فضا شد

اگر به دنبال مدلی مناسب برای استفاده روزمره هستید، فهرست TechRadar از بهترین تولیدکنندگان محتوای هوش مصنوعی برای سال 2024 را بررسی کنید.

شما هم ممکن است دوست داشته باشید

منبع

Related Posts