تبدیل صدا به چهره با هوش مصنوعی+ ویدئو
اندیویا از سیستم هوش مصنوعی جدید خود، «جارویس» رونمایی کرد که توسط آن میتوان صداها را در هنگام صحبت تبدیل به یک چهره مجازی با عملکرد دقیق کرد.
به گزارش جی پلاس، اندیویا از سیستم هوش مصنوعی جدید خود، «جارویس» رونمایی کرد که توسط آن میتوان صداها را در هنگام صحبت تبدیل به یک چهره مجازی با عملکرد دقیق کرد. این شرکت میتواند با فریمورک هوش مصنوعی جارویس مدلهای زیادی تولید کند.
هوش مصنوعی جارویس انویدیا که به احتمال زیاد برای نامگذاری آن از دستیار هوش مصنوعی «مرد آهنی» در فیلمهای مارول الهام گرفته شده، میتواند در بسیاری از صنایع کاربرد داشته باشند. انویدیا در کنفرانس GTC خود اعلام کرد که این فریمورک میتواند از اطلاعات صوتی برای تولید یک چهره مجازی استفاده کند.
«میستی» یکی از مدلهای توسعه یافته توسط هوش مصنوعی انویدیا است و یک آواتار دیجیتال سه بعدی محسوب میشود که درباره وضعیت آب و هوا اطلاعات در اختیار افراد قرار میدهد. این چتبات میتواند سوالات کاربران را متوجه شود و آنها را با حرکات صورت پاسخ دهد.
این هوش مصنوعی بدون اینکه نیاز به ویدیو داشته باشد، میتواند تنها توسط صدا یک چهره را شبیهسازی کند و با حرف زدن، تغییر وضعیت دهد. از این هوش مصنوعی میتوان برای ساخت شخصیتهای کارتونی مشابه با ویژگی انیموجی اپل استفاده کرد، البته عملکرد آنها متفاوت است.
مدیر ارشد بازاریابی فنی بخش محاسبات شتابدهنده انویدیا، «سیدهارت شارما» به این موضوع اشاره کرده که نحوه عملکرد این هوش مصنوعی کاملا متفاوت از انیموجی است چرا که سیستم اپل با استفاده از چهره میتواند شخصیتهای کارتونی ایجاد کند، اما جارویس تنها به اطلاعات صوتی نیاز دارد.
جارویس از اطلاعات صوتی برای ساخت تصاویر سه بعدی استفاده میکند و پوست و عضلات این چهره قادر به تغییر وضعیت و حرکت هستند. شارما این سیستم را با انیمیشنهای تولید شده برای فیلمها مقایسه میکند، با این تفاوت که جارویس به اطلاعات صوتی و الگوریتمهای مخصوصی برای ساخت چهره وابسته است.
با جمعآوری اطلاعات بیشتر توسط هوش مصنوعی، حرکات چهره شباهت بیشتری به انسان پیدا میکند. تبدیل صدا به مدل چهره یکی از صدها مدل آموزش دیده است که به صورت رایگان عرضه میشود. ادغام این هوش مصنوعی در کارتهای گرافیک انویدیا، پاسخگویی آن را افزایش میدهد که این موضوع برای شرکتهایی که بدنبال استفاده از هوش مصنوعی هستند، ضرورت دارد. شارما اعلام کرده:
«چیزی که هم اکنون مشتریان واقعا به آن نیاز دارند، هوش مصنوعی برای مکالمه است که هوشمند و شبیه به انسان باشد. انجام این کار بدون واحد پردازش گرافیکی غیرممکن است، چرا که انجام آن توسط CPU به 25 ثانیه زمان نیاز دارد.»
مطلب مرتبط:
دیدگاه تان را بنویسید