اکثر بهترین ربات ها، آنهایی که می توانند راه بروند، بدوند، از پله ها بالا بروند و پارکور انجام دهند، چهره ندارند و ممکن است دلیل خوبی برای آن وجود داشته باشد. اگر هر یک از آنها فنجان هایی مانند فنجان های روی این ربات تحقیقاتی جدید داشت، احتمالاً جلوی آنها می ایستیم و در حالی که آنها از روی ما می دویدند بی کلام خیره می شدیم.
ساخت ربات هایی با چهره و توانایی تقلید حالات انسان یک جذابیت مداوم در دنیای تحقیقات رباتیک است، اما اگرچه ممکن است برای تامین انرژی آنها به باتری کمتر و موتورهای باربر کمتر نیاز داشته باشد، این نوار برای یک ربات شکلک بسیار بالاتر از این برای یک ربات پرش است.
با این حال، توسعه مهندسی کلمبیا از آخرین ربات خود، ایمو، و “حالت چهره مشترک انسان و ربات” آن کار چشمگیر و مهمی است. در یک مقاله علمی و ویدئوی یوتیوب که اخیراً منتشر شده است، محققان کار خود را توصیف کرده و توانایی ایمو در برقراری تماس چشمی و تقلید و تقلید فوری بیان انسان را نشان میدهند.
اینکه بگوییم مجموعه ای از عبارات شبیه انسان که توسط ربات استفاده می شود عجیب و غریب هستند، دست کم گرفتن است. مانند بسیاری از چهرههای روباتی نسل خود، شکل سر، چشمها و پوست سیلیکونی او همگی شبیه چهره انسان است، اما برای جلوگیری از دره عجیب و غریب ترسناک کافی نیست.
اشکالی ندارد، زیرا هدف ایمو این نیست که امروز یک سر ربات سخنگو در خانه شما قرار دهد. این در مورد برنامه نویسی، تست، یادگیری… و شاید داشتن یک ربات رسا در خانه شما در آینده است.
چشمان ایمو به دو دوربین با کیفیت بالا مجهز شده است که به او اجازه می دهد “تماس چشمی” برقرار کند و از یکی از الگوریتم های خود برای تماشای شما و پیش بینی حالات چهره شما استفاده کند.
از آنجایی که تعامل انسانی اغلب شامل مدلسازی میشود، به این معنی که ما اغلب ناخودآگاه حرکات و حالات افرادی را که با آنها تعامل داریم تقلید میکنیم (دستهای خود را در یک گروه روی هم بزنید و به تدریج دستهای خود را روی هم میبینید)، ایمو از مدل دوم خود برای تقلید حالات صورت استفاده میکند. و او انتظار داشت.
این ربات با مشاهده تغییرات ظریف در صورت انسان، میتواند لبخند نزدیک به انسان را ۸۳۹ میلیثانیه زودتر از یک انسان پیشبینی کند و چهرهاش را طوری تنظیم کند که به طور همزمان لبخند بزند. پژوهشگران را در مقاله خود بنویسید.
در ویدئو، عبارات ایمو به همان سرعتی که عبارات محقق تغییر می کند. هیچ کس نمی تواند ادعا کند که لبخند او شبیه یک لبخند معمولی انسان است، یا اینکه نگاه غمگین او ناامید کننده نیست، یا اینکه نگاه متعجب او ناخوشایند نیست، اما 26 عامل زیرپوستی او بسیار به ارائه یک بیان انسانی قابل تشخیص نزدیک شده اند. .
یوهانگ هو، کاندیدای دکترا در دانشگاه کلمبیا، در این ویدئو گفت: «من فکر میکنم پیشبینی حالات چهره انسان نشاندهنده یک گام بزرگ رو به جلو در زمینه تعامل انسان و ربات است.»
روشی که ایمو در مورد عبارات انسان یاد گرفت حتی شگفت انگیزتر است. برای اینکه بفهمند چهره و موتورهای او چگونه کار می کند، محققان Emu را جلوی دوربین قرار دادند و به او اجازه دادند تا هر حالتی را که می خواهد بیان کند. او رابطه بین حرکات حرکتی و عبارات حاصل را به این ایمو آموزش داد.
آنها همچنین هوش مصنوعی را بر روی عبارات واقعی انسان آموزش دادند. ترکیب این روشهای آموزشی، ایمو را به بیان فوری انسان، همانطور که در ربات دیده میشود، نزدیکتر میکند.
همانطور که محققان در این ویدئو اشاره می کنند، هدف این است که ایمو تبدیل به یک پیشانی برای هوش مصنوعی یا هوش عمومی مصنوعی (در اصل یک هوش مصنوعی متفکر) شود.
Emo تنها چند هفته پس از اینکه Figure AI ربات Figure 01 خود را با فناوری OpenAI و توانایی آن برای درک و عمل بر روی مکالمات انسانی معرفی کرد، وارد بازار میشود. به ویژه، این ربات هیچ چهره ای نداشت.
من فقط می توانم تصور کنم که یک سر ایمو در یک ربات Figure 01 چگونه به نظر می رسد