متا چهار مدل جدید هوش مصنوعی را راه اندازی کرده است که برای توسعه دهندگان در دسترس عموم قرار گرفته است

متا چهار مدل جدید هوش مصنوعی را راه اندازی کرده است که برای توسعه دهندگان در دسترس عموم قرار گرفته است

متا چهار مدل جدید هوش مصنوعی را راه اندازی کرده است که برای توسعه دهندگان در دسترس عموم قرار گرفته است

شکل بالا روند محو شدن زمان را نشان می دهد، جداسازی منبع، جمع بندی و انتشار را نشان می دهد. شکل پایین نمای سطح بالایی از JASCO را نشان می دهد. این اصطلاحات ابتدا بر روی یک نمایش کم بعدی پیش بینی می شوند و از طریق ابعاد کانال به هم متصل می شوند. بلوک های سبز حاوی پارامترهای قابل یادگیری هستند در حالی که بلوک های آبی ثابت هستند. حق چاپ: arksif (2024). DOI: 10.48550/arxiv.2406.10970

تیمی از محققان هوش مصنوعی در تیم تحقیقاتی اصلی هوش مصنوعی متا، چهار مدل هوش مصنوعی جدید را به صورت عمومی در اختیار محققان و توسعه‌دهندگانی قرار می‌دهند که برنامه‌های کاربردی جدید ایجاد می‌کنند. این تیم یک مقاله تحقیقاتی در مورد arksif Prepress Server یکی از مدل های جدید JASCO و نحوه استفاده از آن را نشان می دهد.

با افزایش علاقه به برنامه های کاربردی هوش مصنوعی، بازیگران اصلی در این زمینه در حال ایجاد مدل های هوش مصنوعی هستند که می توانند توسط سایر نهادها برای افزودن قابلیت های هوش مصنوعی به برنامه های خود استفاده شوند. در این تلاش جدید، تیم متا چهار مدل جدید JASCO، AudioSeal و دو نسخه از Chameleon را معرفی کرد.

JASCO برای پذیرش انواع ورودی های صوتی و ایجاد صدای پیشرفته طراحی شده است. تیم می‌گوید این مدل به کاربران اجازه می‌دهد تا ویژگی‌هایی مانند صدای درام، سیم‌های گیتار یا حتی ملودی‌ها را برای ساخت یک ملودی تغییر دهند. فرم همچنین می‌تواند ورودی متن را بپذیرد و از آن برای خوش‌رنگ‌تر کردن ملودی استفاده کند.

نمونه ای از این می تواند درخواست از مدل برای تولید یک ملودی بلوزی که حاوی تعداد زیادی باس و درام باشد. پس از آن توضیحات مشابهی در مورد سایر ماشین ها ارائه می شود. تیم متا همچنین JASCO را با سایر سیستم‌هایی که برای انجام تقریباً مشابه طراحی شده‌اند مقایسه کردند و دریافتند که JASCO در سه معیار کلیدی از آنها بهتر عمل می‌کند.

AudioSeal را می توان برای افزودن واترمارک به گفتار تولید شده توسط یک برنامه کاربردی هوش مصنوعی استفاده کرد و به شما امکان می دهد نتایج را به راحتی به عنوان تولید مصنوعی شناسایی کنید. آنها اشاره می‌کنند که می‌توان از آن برای افزودن واترمارک به بخش‌هایی از گفتار هوش مصنوعی که روی گفتار واقعی پوشانده شده‌اند استفاده کرد و با مجوز تجاری ارائه می‌شود.

هر دو مدل Chameleon متن را به تصاویر بصری تبدیل می کنند و در ظرفیت های محدود منتشر می شوند. این تیم اشاره می کند که نسخه های 7B و 34B به مدل ها نیاز دارند تا درک متن و تصاویر را به دست آورند. به همین دلیل، آنها می توانند پردازش معکوس را انجام دهند، مانند ایجاد زیرنویس برای تصاویر.

اطلاعات بیشتر:
اورتال و همکاران، اقتباس مشترک آکوستیک و نمادین برای تولید موقت متن به موسیقی، arksif (2024). DOI: 10.48550/arxiv.2406.10970

صفحه نمایشی: pages.cs.huji.ac.il/adiyoss-lab/JASCO/

اطلاعات مجله:
arksif

© 2024 Web of Science

نقل قولمتا چهار مدل جدید هوش مصنوعی را منتشر می‌کند که به صورت عمومی برای استفاده توسعه‌دهندگان در دسترس هستند (2024، 3 ژوئیه) بازیابی شده در 5 ژوئیه 2024 از https://techxplore.com/news/2024-07-meta-ai.html

این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. علیرغم هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی از آن بدون اجازه کتبی قابل تکثیر نیست. محتوا فقط برای مقاصد اطلاعاتی ارائه شده است.

منبع

بخوان  Linktree به تازگی دیوارهای پرداخت محتوا را دریافت کرده است | TechRadar