OpenAI در سال گذشته به سرعت در حال توسعه چت ربات هوش مصنوعی ChatGPT و خالق ویدیوی Sora AI خود بوده است و اکنون ابزار هوش مصنوعی جدیدی برای نشان دادن دارد: Voice Generation که می تواند صداهای مصنوعی را تنها با 15 ثانیه صدا ایجاد کند.
در یک پست وبلاگ (از طریق The Verge)، OpenAI میگوید که «پیشنمایش در مقیاس کوچک» Voice Engine را اجرا میکند، که از اواخر سال 2022 در حال توسعه است. در واقع در حال حاضر در ویژگی Read Aloud در برنامه ChatGPT استفاده میشود. که (همانطور که از نامش پیداست) پاسخ ها را برای شما می خواند.
هنگامی که صدا را از یک نمونه 15 ثانیه ای آموزش دادید، سپس می توانید آن را وادار کنید تا هر متنی را که دوست دارید، به روشی “احساس آمیز و واقعی” بخواند. OpenAI میگوید که میتواند برای اهداف آموزشی، برای ترجمه پادکستها به زبانهای جدید، برای دسترسی به جوامع دوردست و برای حمایت از افرادی که غیرکلامی هستند، استفاده شود.
این چیزی نیست که همه در حال حاضر بتوانند از آن استفاده کنند، اما میتوانید بروید و به نمونههای ایجاد شده توسط Voice Engine گوش دهید. کلیپهایی که OpenAI منتشر کرده است، صدایی بسیار چشمگیر دارند، اگرچه لبههای رباتیک و خمیدهای در آنها وجود دارد.
اول ایمنی
نگرانی در مورد سوء استفاده دلیل اصلی این است که Voice Engine در حال حاضر تنها در یک پیشنمایش محدود است: OpenAI میگوید که میخواهد تحقیقات بیشتری در مورد اینکه چگونه میتواند از ابزارهایی مانند این در برابر استفاده برای انتشار اطلاعات نادرست و کپی صداها بدون رضایت محافظت کند، انجام دهد.
OpenAI میگوید: «ما امیدواریم که گفتوگویی را در مورد استقرار مسئولانه صداهای مصنوعی و اینکه چگونه جامعه میتواند با این قابلیتهای جدید سازگار شود، آغاز کنیم. بر اساس این گفتگوها و نتایج این آزمایشات در مقیاس کوچک، ما تصمیم آگاهانه تری در مورد اینکه آیا و چگونه این فناوری را در مقیاس اجرا کنیم، خواهیم گرفت.
با توجه به برگزاری انتخابات بزرگ در ایالات متحده و بریتانیا در سال جاری، و ابزارهای مولد هوش مصنوعی که همیشه پیشرفتهتر میشوند، نگرانی در مورد هر نوع محتوای هوش مصنوعی (صوتی، متنی و ویدیویی) وجود دارد و دانستن اینکه چه چیزی را باید دشوارتر کرد. اعتماد
همانطور که OpenAI خود اشاره می کند، این پتانسیل ایجاد مشکلاتی در اقدامات احراز هویت صوتی و کلاهبرداری هایی است که ممکن است ندانید با چه کسی از طریق تلفن صحبت می کنید یا چه کسی برای شما پست صوتی گذاشته است. حل این مسائل آسان نیست – اما ما باید راه هایی برای مقابله با آنها پیدا کنیم.