امروزه مکالمات ویدیوئی در بین کاربران بسیار رایج شده است و شرکت Nvidia نیز در این میان قصد دارد با استفاده از فناوریهای نرم افزاری جدیدش در مسیر بهبود کیفیت مکالمات ویدیوئی قدم بردارد. شرکت Nvidia پلتفرم هوش مصنوعی ابری خود را با نام Nvidia Maxine معرفی کرده است که این امکان را به توسعه دهندگان میدهد تا با استفاده از آن کیفیت نرم افزار ویدیو کنفرانس خود را بهبود دهند. از جمله بهبودهایی که این فناوری انجام میدهد میتوان به حذف نویز پس زمینه، کاهش پهنای باند، بهینه سازی مقیاس رزولوشن، ترجمۀ زنده و Closed Captioning اشاره کرد.
فناوری Nvidia Maxine، هوش مصنوعی قویتر از گذشته!
شرکت Nvidia میگوید Maxine با استفاده از هوش مصنوعی با آنالیز نقاط محیط در چهرۀ کاربر آن را شناسایی میکند و سپس با re-animate کردن چهره پهنای باند مورد نیاز برای تماس ویدیوئی را کاهش میدهد. به لطف این قابلیت دیگر نیازی نیست تا تمام فریمهای ویدیو در تماس ویدیوئی استریم شوند. شرکت Nvidia ادعا کرده است که با استفاده از این قابلیت، پهنای باند مورد نیاز تماس ویدیوئی به همراه فشردهسازی با فرمت H.264 به یک دهم میرسد. این قابلیت به افرادی که سرویس اینترنت محدودی در اختیار دارند کمک بسزایی میکند.
فناوری Nvidia Maxine قابلیت دیگری دارد که با استفاده از آن قادر است جهت و زاویۀ صورت کاربر را اصلاح کند. این ویژگی بدین صورت عمل میکند که اگر شخصی که در مقابل دوربین ایستاده است زاویۀ مستقیم با دوربین ندارد و یا اصلاً به دوربین نگاه نمیکند، Nvidia Maxine با استفاده از هوش مصنوعی چهره شخص را بازسازی کرده و در جهت و زاویۀ درست قرار میدهد. همچنین توسعه دهندگان قادر خواهند بود تا از Emojiهای متحرک که بر اساس صدای شخص حرکت میکنند نیز استفاده کنند. پس از گذشت ماهها توسعه سرانجام دستیارهای صوتی نیز در تماسهای ویدیوئی قابل استفاده خواهند بود و کاربران میتوانند از تمام قابلیتهای دستیار صوتی خود که با صدایی نظیر یک انسان به فرمانهای آنها پاسخ میدهد استفاده کنند.
Nvidia Maxine قطعاً در تجربۀ کاربران تأثیر مثبت خواهد داشت
امروزه ویدیو کنفرانس به بخشی از زندگی روزمرۀ کاربران تبدیل شده و میلیونها نفر برای آموزش، گیم و یا شغل و حتی ویزیت پزشک از ویدیو کنفرانس بهره میگیرند. یکی از مقامات بالاردۀ شرکت Nvidia در رابطه با فناوری Nvidia Maxine چنین گفته: « فناوری Nvidia Maxine با استفاده از پیشرفتهترین قابلیتهای صوتی و تصویری و هوش مصنوعی در جهت افزایش کیفیت ویدیو کنفرانس و بهبود کارایی نرم افزارهایی که در پلتفرمهای مختلف از آنها برای ویدیو کنفرانس استفاده میکنیم حرکت میکند.»
برخی از ویژگیهای این فناوری نظیر Gaze Detection، Closed Captioning و ترجمۀ زنده قبلاً هم توسط سایر شرکتها در نرمافزارهای مختلف اجرا شدهاند هرچند که شرکت Nvidia با طراحی این فناوری به صورت ابری (Cloud Based) سبب این شده تا توسعه دهندگان برای بهرهمندی از آن نیازی به تهیه کارت گرافیکهای قوی و گران قیمت نداشته باشند. در حال حاضر تنها سرویسی ویدیو کنفرانسی که از Nvidia Maxine پشتیبانی میکند Avaya است.