شرکت هوش مصنوعی Anthropic در حال پیش نمایش “خانواده” جدید خود از مدل های Claude 3 است که ادعا می کند می توانند از Gemini گوگل و ChatGPT OpenAI در چندین بنچمارک بهتر عمل کنند.
این گروه از سه AI با درجات مختلف “قابلیت” تشکیل شده است. شما Claude 3 Haiku را در پایین دارید، به دنبال آن Claude 3 Sonnet، و سپس Claude 3 Opus به عنوان سگ برتر وجود دارد. Anthropic ادعا می کند که این سه نفر به دلیل چندوجهی بودن، سطح بهبود یافته دقت، درک بهتر زمینه و سرعت، “عملکرد قدرتمند” را در سراسر صفحه ارائه می دهند. نکته قابل توجه در مورد این سه نفر این است که آنها تمایل بیشتری برای پاسخ به سؤالات سخت خواهند داشت.
آنتروپیک توضیح میدهد که نسخههای قدیمیتر کلود گاهی از پاسخ دادن به درخواستهایی که مرزهای نردههای ایمنی را جابجا میکنند، خودداری میکنند. اکنون، خانواده کلود 3 با پاسخهای خود رویکرد متفاوتتری خواهند داشت که به آنها اجازه میدهد به این سوالات پیچیده پاسخ دهند.
علیرغم افزایش عملکرد همه جانبه، بیشتر اعلامیه ها بر روی Opus به عنوان بهترین در همه این زمینه ها متمرکز شده است. آنها تا آنجا پیش میروند که میگویند این مدل «سطوح درک تقریباً انسانی را نشان میدهد… (برای) کارهای پیچیده».
هوش مصنوعی تخصصی
برای آزمایش آن، آنتروپیک Opus را از طریق ارزیابی “Needle In a Haystack” یا NIAH قرار داد تا ببیند چقدر می تواند داده ها را به خاطر بیاورد. همانطور که به نظر می رسد، بسیار خوب است زیرا هوش مصنوعی می تواند اطلاعات را با جزئیات تقریباً کامل به خاطر بسپارد. این شرکت در ادامه ادعا می کند که Opus یک کوکی کاملا هوشمند است که می تواند مسائل ریاضی را حل کند، کدهای کامپیوتری تولید کند و استدلال بهتری نسبت به GPT-4 نشان دهد.
این فناوری خالی از خصلت نیست. حتی اگر آنتروپیک بیان می کند که هوش مصنوعی آنها دقت را بهبود بخشیده است، هنوز مشکل توهم وجود دارد. پاسخهایی که مدلها ارائه میدهند ممکن است حاوی اطلاعات اشتباه باشند، اگرچه در مقایسه با Claude 2.1 بسیار کاهش یافتهاند. به علاوه، Opus در پاسخ به سوالی با سرعتی قابل مقایسه با کلود 2 کمی کند عمل می کند.
البته، این بدان معنا نیست که هایکو یا سونت کمتر از Opus هستند زیرا موارد استفاده خاصی دارند. به عنوان مثال، هایکو در پاسخ دادن سریع و گرفتن اطلاعات “از داده های بدون ساختار” عالی است. همچنین، در پاسخگویی به سوالات ریاضی به خوبی Opus نیست. Sonnet مدلی در مقیاس بزرگتر است که برای کمک به افراد در صرفه جویی در وقت در کارهای ساده و حتی تجزیه خطوط “متن از تصاویر” طراحی شده است، در حالی که Opus برای عملیات در مقیاس بزرگ ایده آل است.
تغییر اینترنت
هر دو Sonnet و Opus در حال حاضر برای خرید در دسترس هستند، اگرچه یک نسخه رایگان از Claude در وب سایت شرکت وجود دارد. تاریخ عرضه هایکو مشخص نشده است، اما Anthropic اعلام کرده که به زودی منتشر خواهد شد.
همانطور که احتمالاً می توانید حدس بزنید، سه گانه Claude 3 بیشتر برای مشاغلی طراحی شده است که به دنبال خودکارسازی بارهای کاری خاص هستند. تجربه شما با گروه احتمالاً در قالب یک چت بات آنلاین خواهد بود. آمازون اخیراً اعلام کرده است که هوش مصنوعی جدید Anthropic را در AWS (سرویسهای وب آمازون) پیادهسازی میکند که به وبسایتهای روی پلتفرم راهی برای ایجاد یک مدل Claude 3 سفارشی برای مطابقت با نیازهای برندها و مشتریانشان میدهد.
اگر به دنبال مدلی مناسب برای استفاده روزمره هستید، فهرست TechRadar از بهترین تولیدکنندگان محتوای هوش مصنوعی برای سال 2024 را بررسی کنید.