اولین مدل هوش مصنوعی برای تبدیل متن به صدا

شرکت متا اولین مدل هوش مصنوعی خود را در زمینه تبدیل متن به صدا معرفی می‌کند.

جی پلاس؛ شرکت متا اولین پیشنهادات خود در زمینه هوش مصنوعی را از زمان رشد صنعت تولید هوش مصنوعی در اواخر سال ۲۰۲۲ ارائه کرد. انتظار می‌رود برنامه تبدیل متن به صدای این برند، به نام Voicebox، معادل صوتی ربات ChatGPT باشد که پیام‌های متنی را پردازش می‌کند.

باشگاه خبرنگاران جوان نوشت؛ Voicebox به نوبه خود قادر به دریافت پیام‌های متنی و تولیدکلیپ‌های صوتی خواهد بود.

این برنامه با بیش از ۵۰ هزار ساعت صوت بدون فیلتر، از جمله گفتار و متون حوزه عمومی به زبان‌های انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی آموزش داده شده است.

Voicebox مایل به ایجاد نتایج در گفتار مکالمه در انواع زبان‌های موجود است. متا همچنین ادعا می‌کند که مدل آن نسبت به مدل‌های دیگر، دارای نرخ خطای یک درصدی است.

به گفته محققان متا، این مدل با پیش‌بینی بلوک‌های گفتار در متن به جای ایجاد یک مجموعه کاری از ابتدا، آموزش داده شده است.

این ابزار همچنین توانایی ویرایش کلیپ‌های صوتی دارای اعوجاج ناخواسته یا کلمات اشتباه به روشی مشابه با نرم افزار‌های ویرایش تصویر ثابت، مانند Adobe Photoshop دارد.

متا اعلام کرد که در حال حاضر قصد ندارد برنامه Voicebox یا کد منبع آن را به دلیل "خطرات احتمالی سوء استفاده" برای عموم منتشر کند.

این در حالی است که اپل به تازگی اولین هدست ویژن پرو خود را معرفی کرده و در حال سرمایه گذاری روی واقعیت مجازی است، اما اپل علاقه خاصی به هوش مصنوعی نشان نداده است.