سینت سایزر صوتی جدید OpenAI می تواند صدای شما را تنها از 15 ثانیه صدا کپی کند

OpenAI در سال گذشته به سرعت در حال توسعه چت ربات هوش مصنوعی ChatGPT و خالق ویدیوی Sora AI خود بوده است و اکنون ابزار هوش مصنوعی جدیدی برای نشان دادن دارد: Voice Generation که می تواند صداهای مصنوعی را تنها با 15 ثانیه صدا ایجاد کند.

در یک پست وبلاگ (از طریق The Verge)، OpenAI می‌گوید که «پیش‌نمایش در مقیاس کوچک» Voice Engine را اجرا می‌کند، که از اواخر سال 2022 در حال توسعه است. در واقع در حال حاضر در ویژگی Read Aloud در برنامه ChatGPT استفاده می‌شود. که (همانطور که از نامش پیداست) پاسخ ها را برای شما می خواند.

هنگامی که صدا را از یک نمونه 15 ثانیه ای آموزش دادید، سپس می توانید آن را وادار کنید تا هر متنی را که دوست دارید، به روشی “احساس آمیز و واقعی” بخواند. OpenAI می‌گوید که می‌تواند برای اهداف آموزشی، برای ترجمه پادکست‌ها به زبان‌های جدید، برای دسترسی به جوامع دوردست و برای حمایت از افرادی که غیرکلامی هستند، استفاده شود.

این چیزی نیست که همه در حال حاضر بتوانند از آن استفاده کنند، اما می‌توانید بروید و به نمونه‌های ایجاد شده توسط Voice Engine گوش دهید. کلیپ‌هایی که OpenAI منتشر کرده است، صدایی بسیار چشمگیر دارند، اگرچه لبه‌های رباتیک و خمیده‌ای در آنها وجود دارد.

اول ایمنی

برنامه اندروید ChatGPT

Voice Engine قبلاً در ویژگی Read Aloud ChatGPT استفاده شده است (اعتبار تصویر: OpenAI)

نگرانی در مورد سوء استفاده دلیل اصلی این است که Voice Engine در حال حاضر تنها در یک پیش‌نمایش محدود است: OpenAI می‌گوید که می‌خواهد تحقیقات بیشتری در مورد اینکه چگونه می‌تواند از ابزارهایی مانند این در برابر استفاده برای انتشار اطلاعات نادرست و کپی صداها بدون رضایت محافظت کند، انجام دهد.

بخوان ساخت لوگوی ناسا با یک سوپرآلیاژ جدید چاپ سه‌بعدی

OpenAI می‌گوید: «ما امیدواریم که گفت‌وگویی را در مورد استقرار مسئولانه صداهای مصنوعی و اینکه چگونه جامعه می‌تواند با این قابلیت‌های جدید سازگار شود، آغاز کنیم. بر اساس این گفتگوها و نتایج این آزمایشات در مقیاس کوچک، ما تصمیم آگاهانه تری در مورد اینکه آیا و چگونه این فناوری را در مقیاس اجرا کنیم، خواهیم گرفت.

با توجه به برگزاری انتخابات بزرگ در ایالات متحده و بریتانیا در سال جاری، و ابزارهای مولد هوش مصنوعی که همیشه پیشرفته‌تر می‌شوند، نگرانی در مورد هر نوع محتوای هوش مصنوعی (صوتی، متنی و ویدیویی) وجود دارد و دانستن اینکه چه چیزی را باید دشوارتر کرد. اعتماد

همانطور که OpenAI خود اشاره می کند، این پتانسیل ایجاد مشکلاتی در اقدامات احراز هویت صوتی و کلاهبرداری هایی است که ممکن است ندانید با چه کسی از طریق تلفن صحبت می کنید یا چه کسی برای شما پست صوتی گذاشته است. حل این مسائل آسان نیست – اما ما باید راه هایی برای مقابله با آنها پیدا کنیم.

شما هم ممکن است دوست داشته باشید

منبع

Related Posts