تبدیل صدا به چهره با هوش مصنوعی+ ویدئو

اندیویا از سیستم هوش مصنوعی جدید خود، «جارویس» رونمایی کرد که توسط آن می‌توان صداها را در هنگام صحبت تبدیل به یک چهره مجازی با عملکرد دقیق کرد.

به گزارش جی پلاس، اندیویا از سیستم هوش مصنوعی جدید خود، «جارویس» رونمایی کرد که توسط آن می‌توان صداها را در هنگام صحبت تبدیل به یک چهره مجازی با عملکرد دقیق کرد. این شرکت می‌تواند با فریمورک هوش مصنوعی جارویس مدل‌های زیادی تولید کند.

هوش مصنوعی جارویس انویدیا که به احتمال زیاد برای نام‌گذاری آن از دستیار هوش مصنوعی «مرد آهنی» در فیلم‌های مارول الهام گرفته شده، می‌تواند در بسیاری از صنایع کاربرد داشته باشند. انویدیا در کنفرانس GTC خود اعلام کرد که این فریمورک می‌تواند از اطلاعات صوتی برای تولید یک چهره مجازی استفاده کند.

«میستی» یکی از مدل‌های توسعه یافته توسط هوش مصنوعی انویدیا است و یک آواتار دیجیتال سه بعدی محسوب می‌شود که درباره وضعیت آب و هوا اطلاعات در اختیار افراد قرار می‌دهد. این چت‌بات می‌تواند سوالات کاربران را متوجه شود و آن‌ها را با حرکات صورت پاسخ دهد.

این هوش مصنوعی بدون اینکه نیاز به ویدیو داشته باشد، می‌تواند تنها توسط صدا یک چهره را شبیه‌سازی کند و با حرف زدن، تغییر وضعیت دهد. از این هوش مصنوعی می‌توان برای ساخت شخصیت‌های کارتونی مشابه با ویژگی انیموجی اپل استفاده کرد، البته عملکرد آن‌ها متفاوت است.

مدیر ارشد بازاریابی فنی بخش محاسبات شتاب‌دهنده انویدیا، «سیدهارت شارما» به این موضوع اشاره کرده که نحوه عملکرد این هوش مصنوعی کاملا متفاوت از انیموجی است چرا که سیستم اپل با استفاده از چهره می‌تواند شخصیت‌های کارتونی ایجاد کند، اما جارویس تنها به اطلاعات صوتی نیاز دارد.

جارویس از اطلاعات صوتی برای ساخت تصاویر سه بعدی استفاده می‌کند و پوست و عضلات این چهره قادر به تغییر وضعیت و حرکت هستند. شارما این سیستم را با انیمیشن‌های تولید شده برای فیلم‌ها مقایسه می‌کند، با این تفاوت که جارویس به اطلاعات صوتی و الگوریتم‌های مخصوصی برای ساخت چهره وابسته است.

با جمع‌آوری اطلاعات بیشتر توسط هوش مصنوعی، حرکات چهره شباهت بیشتری به انسان پیدا می‌کند. تبدیل صدا به مدل چهره یکی از صدها مدل آموزش دیده است که به صورت رایگان عرضه می‌شود. ادغام این هوش مصنوعی در کارت‌های گرافیک انویدیا، پاسخگویی آن را افزایش می‌دهد که این موضوع برای شرکت‌هایی که بدنبال استفاده از هوش مصنوعی هستند، ضرورت دارد. شارما اعلام کرده:

«چیزی که هم اکنون مشتریان واقعا به آن نیاز دارند، هوش مصنوعی برای مکالمه است که هوشمند و شبیه به انسان باشد. انجام این کار بدون واحد پردازش گرافیکی غیرممکن است، چرا که انجام آن توسط CPU به 25 ثانیه زمان نیاز دارد.»

مطلب مرتبط: