رویکرد ریاضی Infinigen به آن اجازه میدهد تا دادههای بصری برچسبگذاری شده را ایجاد کند، که برای آموزش سیستمهای بینایی کامپیوتری، از جمله آنهایی که روی روباتهای خانگی و ماشینهای خودران مستقر هستند، مورد نیاز است. از آنجایی که Infinigen هر تصویر را به صورت برنامهنویسی تولید میکند – ابتدا یک دنیای سه بعدی ایجاد میکند، آن را با اشیا پر میکند، و یک دوربین را برای گرفتن عکس قرار میدهد – Infinigen میتواند به طور خودکار برچسبهای دقیقی درباره هر تصویر از جمله دسته و مکان هر شی ارائه دهد.
علاوه بر این، کاربران Infinigen کنترل دقیقی بر تنظیمات سیستم مانند نور دقیق و زاویه دید دارند و می توانند سیستم را تنظیم کنند تا تصاویر به عنوان داده های آموزشی مفیدتر شوند.
برای ساخت Infinigen، محققان پرینستون با Blender، یک سیستم گرافیکی رایگان و منبع باز از ابزارهای نرم افزاری از پیش ساخته شده که مربوط به دهه 1990 است، شروع کردند. مطابق با روح بلندر، محققان پرینستون کد Infinigen را تحت مجوز سازگار با GPL منتشر کرده اند، به این معنی که هر کسی می تواند آزادانه از آن استفاده کند.
با گسترش گسترده منوی اشیا و مناظر رندر شده سه بعدی، یکی دیگر از مزایای کلیدی Infinigen این است که می تواند توانایی ماشین ها را برای انجام بازسازی های سه بعدی، فقط از پیکسل های 2 بعدی، از فضاهای پیچیده ای که در آنها کار می کنند، افزایش دهد. به گفته دنگ، در حالی که دور شدن از تصاویر دنیای واقعی به تصاویر مصنوعی برای توسعه ماشینها و روباتهایی که در دنیای واقعی حرکت میکنند ممکن است غیرمعمول به نظر برسد، مجموعه دادههای واقعی تصاویر دارای محدودیتهای کلیدی هستند.
نقل قول: مهندسان برای تقویت آینده بینایی کامپیوتر به منبعی قدیمی نگاه می کنند (2023، 7 ژوئیه) بازیابی شده در 7 ژوئیه 2023 از
دنگ گفت: “هدف این است که پوشش Infinigen به قدری خوب شود که این پروژه به مکانی مناسب برای داده های آموزش بینایی کامپیوتر تبدیل شود، هر وظیفه ای که باشد.” “ما می خواهیم Infinigen به یک تلاش مشترک و جامعه محور تبدیل شود که ابزار مفیدی برای بسیاری از کاربران فراهم می کند.”
علاوه بر تولید جهانهای مجازی پر از اشیاء دیجیتالی با اشکال، اندازه، بافت و رنگ طبیعی، قابلیتهای Infinigen به نمایش مصنوعی پدیدههای طبیعی از جمله آتش، ابر، باران و برف گسترش مییابد.
دنگ میگوید: «کاربران میتوانند پارامترها را تغییر دهند تا به همان اندازه واقعی یا غیرواقعی برای کار خاص خود ایجاد کنند. این گستردگی میتواند به اطمینان حاصل شود که ماشینها به طور گسترده برای مدیریت و هدایت طیف کامل محیطهای قابل برخورد آموزش داده میشوند.»
جیا دنگ، دانشیار علوم کامپیوتر در پرینستون و نویسنده ارشد یک مطالعه جدید که جزئیات سیستم نرم افزاری را ارائه می دهد، گفت: Infinigen یک برنامه پویا برای ساختن صحنه های طبیعی نامحدود، متنوع و واقعی است. مقاله در CVPR 2023 کنفرانس.
این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.
به نظر میرسد هوش مصنوعی برای ایجاد مجموعههای عظیمی از تصاویر مورد نیاز برای آموزش ماشینهای خودران و سایر ماشینها برای دیدن محیطشان عالی است، اما سیستمهای هوش مصنوعی مولد فعلی دارای کاستیهایی هستند که میتواند استفاده از آنها را محدود کند. در حال حاضر، مهندسان در پرینستون یک سیستم نرم افزاری برای غلبه بر این محدودیت ها ایجاد کرده اند و به سرعت مجموعه های تصویری را برای آماده سازی ماشین ها برای تقریباً هر تنظیمات بصری ایجاد کرده اند.
محققان امیدوارند که Infinigen به یک ابزار مشارکتی تبدیل شود و به کاربران اجازه دهد ویژگی های بیشتری را در حین توسعه اضافه کنند.
سپس میتوان از تصاویر با برچسبهای خودکار برای آموزش ربات برای تشخیص و مکانیابی اشیایی که فقط یک تصویر به عنوان ورودی داده شده است استفاده کرد. به گفته دنگ، چنین دادههای بصری برچسبگذاریشدهای با تولیدکنندههای تصویر هوش مصنوعی موجود امکانپذیر نخواهد بود، زیرا این برنامهها تصاویر را با استفاده از یک شبکه عصبی عمیق تولید میکنند که اجازه استخراج برچسبها را نمیدهد.
دنگ گفت: “ما انتظار داریم که Infinigen نه تنها برای ایجاد داده های آموزشی برای بینایی کامپیوتر، بلکه برای واقعیت افزوده و مجازی، توسعه بازی، فیلم سازی، چاپ سه بعدی و به طور کلی تولید محتوا، منبع مفیدی باشد.”
سیستم جدید به نام Infinigen، برای ایجاد اشیاء و محیط های طبیعی در سه بعدی به ریاضیات متکی است. Infinigen یک مولد رویهای است که در علوم کامپیوتر به برنامهای اشاره میکند که محتوایی را بر اساس الگوریتمهای خودکار و طراحیشده توسط انسان ایجاد میکند تا وارد کردن دستی دادهها یا شبکههای عصبی که هوش مصنوعی مدرن را تامین میکنند. به این ترتیب، برنامه جدید تعداد بی شماری از اشیاء سه بعدی را با استفاده از قوانین ریاضی تصادفی تولید می کند.
برای Infinigen، محققان پرینستون برنامههای فرعی به نام ژنراتور طراحی کردند که در تولید انواع مجزا از اشیاء دیجیتالی تخصص دارند – به عنوان مثال، “ماهی” یا “کوه”. کاربران می توانند با زیربرنامه ها کار کنند تا طیف وسیعی از پارامترها از جمله اندازه، بافت، رنگ و بازتاب را تنظیم کنند.
دنگ گفت: «مجموعه دادههای مصنوعی تصاویر سهبعدی وعدههای اولیه خوبی را نشان دادهاند، و ما Infinigen را برای تحقق بیشتر این وعده توسعه دادیم.»
برای شروع، کامپیوترهایی که رباتها و ماشینهای هوشمند را هدایت میکنند، تصاویر و سایر اشیاء بصری را مانند انسان درک نمیکنند. تصویری که برای انسان سه بعدی به نظر می رسد فقط مجموعه ای دو بعدی از پیکسل ها برای کامپیوتر است. برای اینکه ربات ها بتوانند یک تصویر را به صورت سه بعدی درک کنند، تصویر باید شامل دستورالعملی به نام “حقیقت زمینی سه بعدی” باشد. انجام این کار با تصاویر دو بعدی موجود دشوار است، اما برای سیستمی مانند Infinigen آسان است.
اطلاعات بیشتر:
گزارش: جهان های فوتورئالیستی بی نهایت با استفاده از تولید رویه ای