رونمایی از Voice Engine، هوش مصنوعی تقلید صدا

هوش مصنوعی

11 فروردین 1403

هوش مصنوعی تقلید صدا Voice Engine شرکت OpenAI می‌تواند متون را با صدای شما در زبان‌های مختلف بخواند

دنیای پردازش آنلاین: شرکت OpenAI وارد دنیای مدل‌های هوش مصنوعی تقلید صدا شد. این شرکت از هوش مصنوعی تقلید صدا Voice Engine‌ رونمایی کرده است که می‌تواند با کلیپ‌های صوتی ۱۵ ثانیه‌ای، صدای مصنوعی بسازد. این صدای تولیدشده با هوش مصنوعی می‌تواند دستورات متنی را به زبان‌های مختلفی بخواند؛ البته این ابزار به‌طور بسیار محدود عرضه شده است.

به گزارش دیجیاتو درحال‌حاضر شرکت‌های بسیار کمی ازجمله Age of Learning و HeyGen به ابزار جدید OpenAI دسترسی پیدا کرده‌اند. در نمونه‌های صوتی که OpenAI منتشر کرده است، زبان‌های مختلفی ازجمله انگلیسی، آلمانی، فرانسوی و ژاپنی به‌چشم می‌خورند. درحقیقت این ابزار نه‌تنها می‌تواند با زبان اصلی فایل صوتی، متن‌های مختلف را بخواند، بلکه قابلیت خواندن متن به زبان‌های دیگر را نیز دارد.

به گفته OpenAI، این شرکت از اواخر ۲۰۲۲ شروع به توسعه Voice Engine کرده است و این فناوری هم‌اکنون در API تبدیل متن به صدا و همچنین قابلیت Read Aloud چت‌بات ChatGPT وجود دارد. به گفته یکی از اعضای تیم محصول Voice Engine به نام «جف هریس»، این ابزار با ترکیبی از داده‌های دارای حق کپی‌رایت و داده‌های عمومی آموزش داده شده و تنها در اختیار حدود ۱۰ توسعه‌دهنده قرار گرفته است.

در ادامه، صدای تولیدشده توسط Age of Learning‌ را می‌شنوید که در آن هوش مصنوعی با صدای مرجع، درباره زیست‌شناسی و شیمی صحبت می‌کند. همان‌طور که بالاتر گفتیم، این ابزار با استفاده از صدای شما، متن درخواستی‌تان را می‌خواند.

صدای مرجع

صدای تولیدشده با هوش مصنوعی درباره زیست‌شناسی

صدای تولیدشده با هوش مصنوعی درباره شیمی

قابلیت تبدیل متن به صدا با هوش مصنوعی درحال تکامل است و درحالی‌که بسیاری از شرکت‌ها روی تولید صداهای طبیعی یا آلات موسیقی تمرکز کرده‌اند، استارتاپ‌های کمی به‌سراغ تولید صدای افراد رفته‌اند. البته در میان همین استارتاپ‌ها، نام‌های مطرحی مانند ElevenLabs هم وجود دارد.

درحالی OpenAI به‌سراغ ابزار تقلید صدا رفته است که نگرانی‌هایی درباره سوءاستفاده از این ابزارها وجود دارد. بااین‌حال، OpenAI می‌گوید با شرکا در رابطه با پیروی از سیاست‌های خود به توافق رسیده است. طبق این سیاست‌ها، نباید از هوش مصنوعی تقلید صدای OpenAI برای جعل هویت افراد و سازمان‌ها بدون رضایت آن‌ها استفاده کرد.

OpenAI همچنین از شرکای خود می‌خواهد که «رضایت صریح و آگاهانه» گوینده اصلی را داشته باشند. به صداهای تولیدشده با هوش مصنوعی، واترمارک زده می‌شود تا بتوان منشأ آن‌ها را پیدا کرد و البته روی نحوه استفاده از آن‌ها نظارت داشت.

سازنده ابزار تقلید صدا Voice Engine چندین گام را برای محدودکردن امکان سوءاستفاده از این ابزارها پیشنهاد کرده است. ازجمله این پیشنهادها می‌توان به حذف تدریجی احراز هویت صوتی برای دسترسی به حساب‌های بانکی، تنظیم سیاست‌هایی برای محافظت از صدای افراد در هوش مصنوعی، آموزش‌های بهتر درباره دیپ‌فیک و همچنین توسعه سیستم‌های ردیابی محتواهای ساخته‌شده با هوش مصنوعی اشاره کرد.

رونمایی از Voice Engine، هوش مصنوعی تقلید صدا

هوش مصنوعی

هوش مصنوعی تقلید صدا Voice Engine شرکت OpenAI می‌تواند متون را با صدای شما در زبان‌های مختلف بخواند

صدای مرجع

صدای تولیدشده با هوش مصنوعی درباره زیست‌شناسی

صدای تولیدشده با هوش مصنوعی درباره شیمی

مطالب جدید

رونمایی اسپیس ایسکس از لباس فضایی فوق پیشرفته

ferrari 12Cilindri با قدرت ۸۲۰ اسب بخار

Raven Pocket 5، کولر پوشیدنی سونی

به‌روزرسانی جدید و جالب استیکرهای اینستاگرام

دیدگاهتان را بنویسید لغو پاسخ

پربازدیدترین‌ها

برای حمایت از محیط زیست؛ لباس نخرید، قرض بگیرید!

موتور جدید آمونیاکی: 90درصد آلایندگی کمتر

احتمالا ریزپلاستیک‌ها به مغز انسان‌ها هم راه یافته‌اند

ساعات کار طولانی در جوانی، احتمال افسردگی و بیماری در میانسالی

احتمال پایان تغییر ساعت در اروپا

تولید انرژی از آب و هوا توسط باتری کاغذی!

آزمایش اولین فناوری «مسدود کننده خورشید» برای مقابله با گرمایش جهانی

جنگ پنهان ترکیه با ایران در حوزه آب

نتایج یک مطالعه جدید: گیاهان موقع قطع شاخه‌ها جیغ می‌کشند!

زباله‌دانی به وسعت اعماق اقیانوس‌ها

مطالب ماهنامه

بیت‌کوین در سراشیبی سقوط؟

یک پیشنهاد کلیدی: آغاز طراحی داخلی از کفپوش!

تبِ مال سازی، بار کجی که به منزل نمی رسد

وبگردی

ساعات کار طولانی در جوانی، احتمال افسردگی و بیماری در میانسالی

احتمال پایان تغییر ساعت در اروپا

عربستان در رؤیای پیوستن به لیست ۱۰ مقصد برتر گردشگری جهان

بخش های مهم

دنیای پردازش آنلاین در شبکه‌های اجتماعی :