کمپانی OpenAI، صاحب ربات چت ChatGPT، دنیای هوش مصنوعی را دوباره تکان خواهد داد. این بار با یک ابزار هوش مصنوعی به نام Voice Engine که متاسفانه شاید هیچوقت بهطور گسترده در دسترس عموم قرار نگیرد.
به گزارش گجت نیوز، این فناوری فوق العاده میتواند تنها با ۱۵ ثانیه نمونه صدا، صداهای مصنوعی بسیار واقعگرایانهای را تولید کند. این ابزار دنیای جدیدی از امکانات را پیش روی ما میگذارد، دنیایی که انگار از دل یک فیلم اکشن جاسوسی بیرون آمده است.
ابزاری را تصور کنید که بتواند هر متنی را با صدایی طبیعی بخواند، حتی احساسات را تقلید کند. این پتانسیل Voice Engine است که در حال حاضر در یک پیش نمایش محدود برای قابلیت «خواندن با صدای بلند» اپلیکیشن ChatGPT از OpenAI استفاده میشود. کاربردهای این فناوری فراتر از سرگرمی است.
Voice Engine میتواند انقلابی در آموزش ایجاد کند، پادکستها را به زبانهای جدید ترجمه کند و به افرادی که قادر به صحبت کردن نیستند کمک کند تا ارتباط برقرار کنند.
با این حال قدرت این فناوری، مسئولیت روی دوش سازنده آن را سنگین میکند. OpenAI پتانسیل سوء استفاده از آن، مانند گسترش اطلاعات غلط یا جعل صدای اشخاص را تأیید میکند.
به همین دلیل، Voice Engine فعلاً در دسترس عموم قرار نمیگیرد. OpenAI قصد دارد از طریق تحقیق و بحثهای آزاد به این نگرانیها رسیدگی کند. آنها امیدوارند بهترین راه را برای استفاده از این ابزار قدرتمند پیدا کنند و جامعه را برای این عصر جدید مبتنی بر هوش مصنوعی آماده کنند.
این تمرکز بر توسعه مسئولانه بسیار مهم است. با باورپذیرتر شدن دیپ فیک ها و سایر محتوای تولید شده توسط هوش مصنوعی، تشخیص واقعی از مصنوعی به طور فزایندهای دشوار میشود.
OpenAI چالشها از جمله مشکلات احتمالی با احراز هویت صوتی و کلاهبرداریهای تلفنی را تأیید میکند. یافتن راه حل برای این مشکلات با پیشرفت فناوری صدای مصنوعی بسیار مهم خواهد بود. باید منتظر ماند و دید که در آینده چه اتفاقی خواهد رخ داد.