مهندسان برای تقویت آینده بینایی کامپیوتر به منبعی قدیمی نگاه می کنند

رویکرد ریاضی Infinigen به آن اجازه می‌دهد تا داده‌های بصری برچسب‌گذاری شده را ایجاد کند، که برای آموزش سیستم‌های بینایی کامپیوتری، از جمله آن‌هایی که روی روبات‌های خانگی و ماشین‌های خودران مستقر هستند، مورد نیاز است. از آنجایی که Infinigen هر تصویر را به صورت برنامه‌نویسی تولید می‌کند – ابتدا یک دنیای سه بعدی ایجاد می‌کند، آن را با اشیا پر می‌کند، و یک دوربین را برای گرفتن عکس قرار می‌دهد – Infinigen می‌تواند به طور خودکار برچسب‌های دقیقی درباره هر تصویر از جمله دسته و مکان هر شی ارائه دهد.

علاوه بر این، کاربران Infinigen کنترل دقیقی بر تنظیمات سیستم مانند نور دقیق و زاویه دید دارند و می توانند سیستم را تنظیم کنند تا تصاویر به عنوان داده های آموزشی مفیدتر شوند.

برای ساخت Infinigen، محققان پرینستون با Blender، یک سیستم گرافیکی رایگان و منبع باز از ابزارهای نرم افزاری از پیش ساخته شده که مربوط به دهه 1990 است، شروع کردند. مطابق با روح بلندر، محققان پرینستون کد Infinigen را تحت مجوز سازگار با GPL منتشر کرده اند، به این معنی که هر کسی می تواند آزادانه از آن استفاده کند.

با گسترش گسترده منوی اشیا و مناظر رندر شده سه بعدی، یکی دیگر از مزایای کلیدی Infinigen این است که می تواند توانایی ماشین ها را برای انجام بازسازی های سه بعدی، فقط از پیکسل های 2 بعدی، از فضاهای پیچیده ای که در آنها کار می کنند، افزایش دهد. به گفته دنگ، در حالی که دور شدن از تصاویر دنیای واقعی به تصاویر مصنوعی برای توسعه ماشین‌ها و روبات‌هایی که در دنیای واقعی حرکت می‌کنند ممکن است غیرمعمول به نظر برسد، مجموعه داده‌های واقعی تصاویر دارای محدودیت‌های کلیدی هستند.

بخوان  9 مزیت هاست وردپرس

نقل قول: مهندسان برای تقویت آینده بینایی کامپیوتر به منبعی قدیمی نگاه می کنند (2023، 7 ژوئیه) بازیابی شده در 7 ژوئیه 2023 از

دنگ گفت: “هدف این است که پوشش Infinigen به قدری خوب شود که این پروژه به مکانی مناسب برای داده های آموزش بینایی کامپیوتر تبدیل شود، هر وظیفه ای که باشد.” “ما می خواهیم Infinigen به یک تلاش مشترک و جامعه محور تبدیل شود که ابزار مفیدی برای بسیاری از کاربران فراهم می کند.”

علاوه بر تولید جهان‌های مجازی پر از اشیاء دیجیتالی با اشکال، اندازه، بافت و رنگ طبیعی، قابلیت‌های Infinigen به نمایش مصنوعی پدیده‌های طبیعی از جمله آتش، ابر، باران و برف گسترش می‌یابد.

دنگ می‌گوید: «کاربران می‌توانند پارامترها را تغییر دهند تا به همان اندازه واقعی یا غیرواقعی برای کار خاص خود ایجاد کنند. این گستردگی می‌تواند به اطمینان حاصل شود که ماشین‌ها به طور گسترده برای مدیریت و هدایت طیف کامل محیط‌های قابل برخورد آموزش داده می‌شوند.»

مهندسان برای تقویت آینده بینایی کامپیوتر به منبعی قدیمی نگاه می کنند

محققان پرینستون یک سیستم نرم‌افزار متن‌باز توسعه داده‌اند که تعداد بی‌نهایت صحنه‌های فوتورئالیستی از جهان طبیعی را تولید می‌کند، پیشرفتی که می‌تواند آموزش ماشین‌های خودران و دیگر ربات‌ها را بهبود بخشد. تصویر با حسن نیت از محققان. اعتبار: دانشگاه پرینستون

جیا دنگ، دانشیار علوم کامپیوتر در پرینستون و نویسنده ارشد یک مطالعه جدید که جزئیات سیستم نرم افزاری را ارائه می دهد، گفت: Infinigen یک برنامه پویا برای ساختن صحنه های طبیعی نامحدود، متنوع و واقعی است. مقاله در CVPR 2023 کنفرانس.

این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.





منبع

به نظر می‌رسد هوش مصنوعی برای ایجاد مجموعه‌های عظیمی از تصاویر مورد نیاز برای آموزش ماشین‌های خودران و سایر ماشین‌ها برای دیدن محیطشان عالی است، اما سیستم‌های هوش مصنوعی مولد فعلی دارای کاستی‌هایی هستند که می‌تواند استفاده از آن‌ها را محدود کند. در حال حاضر، مهندسان در پرینستون یک سیستم نرم افزاری برای غلبه بر این محدودیت ها ایجاد کرده اند و به سرعت مجموعه های تصویری را برای آماده سازی ماشین ها برای تقریباً هر تنظیمات بصری ایجاد کرده اند.

محققان امیدوارند که Infinigen به یک ابزار مشارکتی تبدیل شود و به کاربران اجازه دهد ویژگی های بیشتری را در حین توسعه اضافه کنند.

سپس می‌توان از تصاویر با برچسب‌های خودکار برای آموزش ربات برای تشخیص و مکان‌یابی اشیایی که فقط یک تصویر به عنوان ورودی داده شده است استفاده کرد. به گفته دنگ، چنین داده‌های بصری برچسب‌گذاری‌شده‌ای با تولیدکننده‌های تصویر هوش مصنوعی موجود امکان‌پذیر نخواهد بود، زیرا این برنامه‌ها تصاویر را با استفاده از یک شبکه عصبی عمیق تولید می‌کنند که اجازه استخراج برچسب‌ها را نمی‌دهد.

دنگ گفت: “ما انتظار داریم که Infinigen نه تنها برای ایجاد داده های آموزشی برای بینایی کامپیوتر، بلکه برای واقعیت افزوده و مجازی، توسعه بازی، فیلم سازی، چاپ سه بعدی و به طور کلی تولید محتوا، منبع مفیدی باشد.”

سیستم جدید به نام Infinigen، برای ایجاد اشیاء و محیط های طبیعی در سه بعدی به ریاضیات متکی است. Infinigen یک مولد رویه‌ای است که در علوم کامپیوتر به برنامه‌ای اشاره می‌کند که محتوایی را بر اساس الگوریتم‌های خودکار و طراحی‌شده توسط انسان ایجاد می‌کند تا وارد کردن دستی داده‌ها یا شبکه‌های عصبی که هوش مصنوعی مدرن را تامین می‌کنند. به این ترتیب، برنامه جدید تعداد بی شماری از اشیاء سه بعدی را با استفاده از قوانین ریاضی تصادفی تولید می کند.

برای Infinigen، محققان پرینستون برنامه‌های فرعی به نام ژنراتور طراحی کردند که در تولید انواع مجزا از اشیاء دیجیتالی تخصص دارند – به عنوان مثال، “ماهی” یا “کوه”. کاربران می توانند با زیربرنامه ها کار کنند تا طیف وسیعی از پارامترها از جمله اندازه، بافت، رنگ و بازتاب را تنظیم کنند.

دنگ گفت: «مجموعه داده‌های مصنوعی تصاویر سه‌بعدی وعده‌های اولیه خوبی را نشان داده‌اند، و ما Infinigen را برای تحقق بیشتر این وعده توسعه دادیم.»

برای شروع، کامپیوترهایی که ربات‌ها و ماشین‌های هوشمند را هدایت می‌کنند، تصاویر و سایر اشیاء بصری را مانند انسان درک نمی‌کنند. تصویری که برای انسان سه بعدی به نظر می رسد فقط مجموعه ای دو بعدی از پیکسل ها برای کامپیوتر است. برای اینکه ربات ها بتوانند یک تصویر را به صورت سه بعدی درک کنند، تصویر باید شامل دستورالعملی به نام “حقیقت زمینی سه بعدی” باشد. انجام این کار با تصاویر دو بعدی موجود دشوار است، اما برای سیستمی مانند Infinigen آسان است.

اطلاعات بیشتر:
گزارش: جهان های فوتورئالیستی بی نهایت با استفاده از تولید رویه ای

ارائه شده توسط دانشگاه پرینستون