یک بستر آزمایشی برای ارزیابی مهارت های استدلال فیزیکی عوامل هوش مصنوعی

پینتو به Tech Xplore گفت: «استدلال فیزیکی یک قابلیت مهم برای عوامل هوش مصنوعی است تا در دنیای واقعی کار کنند و ما متوجه شدیم که هیچ بستر آزمایشی جامع و معیاری برای ارزیابی هوش استدلال فیزیکی عوامل هوش مصنوعی وجود ندارد. “هدف اولیه ما معرفی یک بستر آزمایشی سازگار با عامل همراه با معیاری برای هوش استدلال فیزیکی، ارزیابی عوامل هوش مصنوعی به همراه انسان ها برای توانایی های استدلال فیزیکی آنها، و ارائه راهنمایی برای عوامل در AIBIRDS بود. مسابقه، یک مسابقه طولانی مدت برای استدلال فیزیکی که در IJCAI برگزار شد و توسط پروفسور یوخن رنز برگزار شد.

Gamage توضیح داد: “از طریق تعمیم محلی، ما توانایی یک عامل را برای تعمیم در قالب یک کار معین و از طریق تعمیم گسترده، ما توانایی یک عامل را برای تعمیم بین الگوهای وظایف مختلف در یک سناریوی معین ارزیابی می کنیم.” علاوه بر این، با ترکیب عملکرد تعمیم گسترده در 15 سناریوی فیزیکی، ما Phy-Q، ضریب استدلال فیزیکی، معیاری الهام گرفته از IQ انسان را اندازه‌گیری می‌کنیم.

این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.





منبع

© 2023 Science X Network

بستر آزمایش Phy-Q می‌تواند به زودی توسط محققان در سراسر جهان برای ارزیابی سیستماتیک قابلیت‌های استدلال فیزیکی مدل هوش مصنوعی در مجموعه‌ای از سناریوهای فیزیکی مورد استفاده قرار گیرد. این به نوبه خود می تواند به توسعه دهندگان کمک کند تا نقاط قوت و ضعف مدل خود را شناسایی کنند تا بتوانند بر اساس آن آنها را بهبود بخشند.

بخوان  بالگرد مریخی نبوغ رکوردشکنی کرد

یک بستر آزمایشی برای ارزیابی مهارت های استدلال فیزیکی عوامل هوش مصنوعی

تصویری که تنظیمات تعمیم محلی و گسترده را در بستر آزمایش Phy-Q و امتیاز Phy-Q بدست آمده توسط عوامل مختلف هوش مصنوعی و انسان نشان می دهد. اعتبار: Xue et al

Xue گفت: «از این مطالعه، ما دیدیم که قابلیت‌های استدلال فیزیکی سیستم‌های هوش مصنوعی بسیار کمتر از سطح توانایی‌های انسان است. “علاوه بر این، ارزیابی ما نشان می‌دهد که عواملی که توانایی تعمیم محلی خوبی دارند برای یادگیری قوانین استدلال فیزیکی اساسی تلاش می‌کنند و در تعمیم کلی ناکام هستند. ما اکنون از محققان دیگر دعوت می‌کنیم تا از بستر آزمایش Phy-Q برای توسعه سیستم‌های هوش مصنوعی استدلال فیزیکی خود استفاده کنند.”

برخی از دانشمندان کامپیوتر تلاش کرده‌اند این توانایی‌های استدلالی را در عوامل هوش مصنوعی (AI) تکرار کنند تا عملکرد آنها را در کارهای خاص بهبود بخشند. با این حال، تاکنون یک رویکرد قابل اعتماد برای آموزش و ارزیابی قابلیت‌های استدلال فیزیکی الگوریتم‌های هوش مصنوعی وجود نداشته است.

بستر آزمایش Phy-Q از 15 سناریو استدلال فیزیکی مختلف تشکیل شده است که از موقعیت‌هایی الهام می‌گیرد که در آن نوزادان توانایی‌های استدلال فیزیکی را کسب می‌کنند و نمونه‌هایی در دنیای واقعی که در آن روبات‌ها ممکن است نیاز به استفاده از این توانایی‌ها داشته باشند. برای هر سناریو، محققان چندین به‌اصطلاح «الگوهای وظیفه» ایجاد کردند، ماژول‌هایی که به آن‌ها اجازه می‌دهد تعمیم‌پذیری مهارت‌های عامل هوش مصنوعی را در تنظیمات محلی و گسترده‌تر اندازه‌گیری کنند. بستر آزمایشی آنها در مجموع شامل 75 الگوی کار است.

یک بستر آزمایشی برای ارزیابی مهارت های استدلال فیزیکی عوامل هوش مصنوعی

تصاویری از وظایف نمونه در Phy-Q که 15 سناریو فیزیکی را نشان می دهد. تیرکمان بچه گانه با پرندگان در سمت چپ وظیفه قرار دارد. هدف مامور این است که با شلیک به پرندگان از تیرکمان، تمام خوک های سبز را بکشد. اجسام قهوه ای تیره سکوهای ساکن هستند. اجسام با رنگ های دیگر پویا هستند و تابع فیزیک محیط هستند. اعتبار: Xue et al

نویسندگان می‌افزایند: «در دنیای واقعی، ما دائماً با موقعیت‌های بدیعی مواجه می‌شویم که قبلاً با آن‌ها مواجه نشده‌ایم و به‌عنوان انسان، در سازگاری موفقیت‌آمیز با آن موقعیت‌های بدیع صلاحیت داریم. “به طور مشابه، برای عاملی که در دنیای واقعی عمل می کند، همراه با قابلیت های استدلال فیزیکی، داشتن قابلیت هایی برای شناسایی و انطباق با موقعیت های جدید بسیار مهم است. بنابراین، تحقیقات آینده ما بر ارتقای توسعه عوامل هوش مصنوعی متمرکز خواهد شد که می توانند انجام وظایف استدلال فیزیکی در موقعیت‌های جدید متفاوت.”

نقل قول: بستر آزمایشی برای ارزیابی مهارت های استدلال فیزیکی عوامل هوش مصنوعی (2023، 8 فوریه) بازیابی شده در 8 فوریه 2023 از

محققان کارایی بستر آزمایشی خود را با استفاده از آن برای اجرای یک سری ارزیابی‌های عامل هوش مصنوعی نشان دادند. نتایج این آزمایش‌ها نشان می‌دهد که مهارت‌های استدلال فیزیکی عوامل هوش مصنوعی هنوز بسیار کمتر از توانایی‌های انسان تکامل یافته است، بنابراین هنوز فضای قابل توجهی برای بهبود در این زمینه وجود دارد.

انسان ها به طور فطری قادر به استدلال در مورد رفتار اشیاء فیزیکی مختلف در محیط اطراف خود هستند. این مهارت‌های استدلال فیزیکی برای حل مشکلات روزمره بسیار ارزشمند هستند، زیرا می‌توانند به ما در انتخاب اقدامات مؤثرتر برای رسیدن به اهداف خاص کمک کنند.

در مطالعات بعدی، نویسندگان قصد دارند بستر آزمون استدلال فیزیکی خود را با رویکردهای یادگیری جهان باز ترکیب کنند. مورد دوم یک حوزه تحقیقاتی نوظهور است که بر بهبود توانایی عوامل هوش مصنوعی و روبات‌ها برای انطباق با موقعیت‌های جدید تمرکز دارد.

اطلاعات بیشتر:
چنگ زو و همکاران، Phy-Q به عنوان معیاری برای هوش استدلال فیزیکی، هوش ماشین طبیعت (2023). DOI: 10.1038/s42256-022-00583-4

Cheng Xue، Vimukthini Pinto، Chathura Gamage و همکارانش، تیمی از محققان در دانشگاه ملی استرالیا، اخیرا Phy-Q را معرفی کردند، یک بستر آزمایشی جدید که برای پر کردن این شکاف در ادبیات طراحی شده است. بستر آزمایش آنها، در مقاله ای در معرفی شده است هوش ماشین طبیعت، شامل مجموعه ای از سناریوها است که به طور خاص توانایی های استدلال فیزیکی عامل هوش مصنوعی را ارزیابی می کند.