پژوهشگران میگویند هوش مصنوعی با استفاده از چیزی به نام «یادگیری تقویتی» میتواند خودش را بهبود بخشد و به عنوان مثال بازیهای آتاری را 600 برابر سریعتر از قبل یاد بگیرد و انجام دهد.
به گزارش ایسنا و به نقل از انگجت، چیزهای زیادی وجود دارند که مدلهای هوش مصنوعی در آنها خوب هستند، اما یکی از چیزهایی هستند که در آن عملکرد بهتری دارند، برای حل آنها کارآمد است و مسائلی که انسان میتواند تقریباً فوراً آنها را حل کند، زمان و دادههای زیادی دارند.
اکنون پژوهشگران دریافت کردهاند که خواندن دستورالعملهای هوش مصنوعی قبل از انجام یک کار میتواند مهارتهای آنها را در تسریع کند. قههههارر ، «یAdahrihe thwhahtی» cenamamیdhedhedhed wh ش شamehtn hhdhydhydhndhndhnhdhnhdhnhdhnhdhnhdhnhdhnhdhnhdhnhdhده
با این روش، اما برای یافتن یک استراتژی کارآمد به آزمون و خطا متکی است. این معناست که این الگوریتمها ممکن است سالها بکشند تا یک فرمول برنده را پیدا کنند.
بر اساس گزارشی که به تازگی منتشر شده است، اکنون گروهی از دانشگاه کارنگی ملون برای کمک به اجرای الگوریتمهای تقویتی با ترکیب آنها با یک مدل زبانی که آموزشها را میخواند، ابداع کرده است و آنها را در هوش مصنوعی برای بازی یک بازی میکند. ویدئویی چالش برانگیز آتاری، هزاران بار سریعتر از مدلی که توسط DeepMind ساخته شده است، موفق بوده است.
یو وو، سرپرست این پژوهش میگوید: کار ما برای اولین بار است که میتواند یک کار انجام کاری را کاملاً خودکار برای بهرهمندی از یک مورد برای یک بازی که به طور خلاصه مطالعه قرار گرفته است، نشان میدهد. ما در حال انجام آزمایشهایی روی بازیهای پیچیدهتر مانند Minecraft هستیم و نتایج امیدوارکنندهای را مشاهده میکنیم. ما معتقدیم ما باید برای مسائل پیچیده اعمال شود.
خلاصه کردن اطلاعات کلیدی
این گروه از پژوهشگران با آموزش یک مدل زبانی برای استخراج و خلاصه کردن اطلاعات کلیدی از کتابچه راهنمای رسمی بازی شروع کرد. سپس از این دادهها برای پرسیدن سؤالات در مورد بازی به یک مدل زبانی از آموزش قبل استفاده میشود.
سپس از پاسخها به دست ها برای ایجاد امتیازهای اضافی برای الگوریتم تقویتی استفاده میشود و به یک الگوریتمآمدی تقویتی تثبیت میشود برای کمک به سریعتر بازیها.
پژوهشگران برای ارزیابی خود، آن را با بازی Skiing 6000 آزمایش کردند که در این بازی هوش مصنوعی باید 8 میلیارد فریم از بازی را اجرا کند تا به عملکردی قابل مقایسه با یک انسان دستماند.
در دريافت اين امكانات به 13 ميليون فريم تا بازي را به آخرين چيزهاي جديد نياز دارد.
در این گزارش که اکنون پژوهشگران به عنوان بازیهای سهبعدی پیچیدهتر مانند Minecraft با نتایج احتمالی امیدوارکنندهها رفتهاند و به دنبال ارزیابی هستند، این است که چگونه پیشرفتهای سریع در مدلهای زبانی مصنوعی مصنوعی میتواند به عنوان یک عامل شتاب برای پیشرفت در این زمینه عمل کند.
این پژوهش در پایگاه پیش از چاپ arXiv منتشر شده است.
انتهای پیام